'2023/07 글 목록 (4 Page)

2023.07.17· AI

- **실제 값과 예측 값의 차이를 제곱하여 평균** - 값이 작을 수록, 예측이 정확하다는 것이다 MSE는 예측이 실제 값에 얼마나 가까운지를 나타내며, 모델의 성능을 평가하는 데 중요한 지표입니다. 평균 제곱 오차(MSE)는 실제 값과 예측 값의 차이를 제곱하여 평균을 낸 것입니다. 이 값이 작을수록 예측이 실제 값과 가까워지며, 크면 클수록 예측이 부정확해집니다. 수식 n은 전체 데이터 포인트의 수 yi는 i번째 실제 값 ŷi는 i번째 데이터 포인트에 대한 예측 값 이는 모델이 예측하는 값이 실제 값에 가까워지도록 독립 변수의 계수를 조정하는 데 사용됩니다. 이러한 과정은 경사 하강법과 같은 최적화 알고리즘을 통해 이루어집니다. 부족한 점이나 잘못 된 점을 알려주시면 시정하겠습니다 :>

계층적 클러스터링

2023.07.16· AI

- 데이터 포인터를 계층적으로 분석해 클러스터링하는 방법 - 병합 클러스터링 : 하향식 - 분할형 클러스터링 : 상향식 계층적 클러스터링은 데이터 포인트들을 계층적인 클러스터나 클러스터의 트리 형태로 만들어가는 클러스터링 방법입니다. Intro 계층적 클러스터링에는 각 데이터 포인트를 초기에는 하나의 클러스터로 간주하고, 기존 클러스터를 계속해서 병합하거나 분할하는 과정을 거칩니다. 이 과정은 모든 데이터 포인트가 하나의 클러스터로 병합될 때까지 계속됩니다. 1. 병합형 계층적 클러스터링 이 방법은 하향식 접근법을 사용합니다. 각 데이터 포인트는 자신만의 클러스터에서 시작하여 단계별로 클러스터들이 결합됩니다. 결국에는 모든 데이터 포인트를 포함한 하나의 클러스터만이 남게 됩니다. 클러스터의 결합은 클러스..

살아있는 지지대

2023.07.15· ETC/Thinking

Intro. 휴식 요즘은 주말엔 해야하는 공부보다 하고 싶은 것들을 배우고, 날 좀 내버려 두고 있다 오늘은 비도 오고 그래서 밖 보면서 멍 때리다 든 생각이다. 살아있는 지지대들 내 주변 사람들은 내 말에 무조건 지지하지 않는다 정도의 차이가 있지만, 내가 도덕적으로 무너지고, 내 책임을 외면 할 때면 우르르 몰려와서 정신차리라며 날 흠신 날 두들겨 줄 사람들이 많다 여기서 멈추지 않아 내 의견 또한, 쉽게 받아들여 지지 않는다 내가 던지는 말에 정서적 호응을 넘어, 비판적으로 바라보고 분석한다 다시금 자신의 생각을 이리저리 뭉쳐서 피드백을 던진다 난 그래서 어떠한가? 당연히 쉽지 않았었다. 그 중에서도 날라오는 피드백을 받고 나도 표현을 해야하는데 그걸 잘하지 못했다 살짝 변태라서 아픈 말이라도 내게..

🐥 카카오테크캠퍼스 - 2단계 3주차 과제 구현

2023.07.14· 프로젝트/카카오 테크 캠퍼스

측정 지표 레퍼지터리 단위 테스트 구현 테스트 메서드의 격리성이 보장 되었는가 테스트 코드 쿼리 관련 메서드가 너무 많은 Select를 유발하지 않는가 과제 목적 핵심은 내가 JPA 테스트를 통해 원하는 데이터를 얻어낼 수 있는가!! 그 데이터를 얻기 위해 너무 많은 select가 유발되지 않았는가? 테스트를 통해 JPA를 좀 더 잘 이해하는 것이다. Product 전체 상품 목록 조회 @Test public void product_findAll_test() throws JsonProcessingException { // given int page = 0; int size = 9; // when PageRequest pageRequest = PageRequest.of(page, size); Page pr..

Intro. 머신러닝 개념 쉽게 잡고 가자

2023.07.13· AI

Intro. 머신러닝 지도 학습(Supervised Learning) : 역사 : 독립 변수 | 종속 변수 독립 변수와 종속 변수로 모델을 만드는 것입니다 문제를 많이 풀면 점점 문제를 맞출 확률이 올라가는 것처럼 또는, 원인으로부터 결과를 도출 하고 싶을 때 사용합니다 과거의 데이터로 학습해서 결과를 예측하는데 올라간다 Regression(회귀) 모델 숫자를 알고 싶은 경우 https://bit.ly/ml1-regression-list : 회귀 사례 Classification 추측하고자 하는 것이 이름인 경우 https://bit.ly/ml1-class-list : 분류 사례 비지도 학습(Unsupervised Learning) : 탐험 : 데이터의 성격 파악 : 변수 | 변수 | 변수 기계에게 데이터..

구조를 파악하라

2023.07.12· ETC/Thinking

구조를 파악하라 - 흔들리지 않는 근본, 본질, 구조를 파악하라 @김종권 교수님은 Machine Learning을 공부하는데 있어 개념을 빠르게 파악하고, 연습 문제를 파라고 한다 uzu도 하나의 프레임워크에 하나정된 사람이 아니라, 베이스를 토대로 문제를 해결 할 수 있는 사람이 되어야 한다고 했다 그런의미에서 uzu는 프론트나 백엔드나 별 차이가 없다고 생각한단다 그런데 사실 이 이야기들은 누구나 알고 있는 이야기이다 근데, 왜 난 그렇게 하지 않을까? 음, 정확히는 왜 이런 중요한 초심을 자주 잊는걸까? 본능적으로 무섭기 때문이지, 당장 무엇이라도 하고 있다는 생각에 취하는거 아닌가 무언가 했다는 위로로 눈을 가리지 말자 부족한 점이나 잘못 된 점을 알려주시면 시정하겠습니다 :>

Service

2023.07.12· Computer Science/디자인패턴

Service - 비즈니스 로직에 대한 책임을 가진다 서비스는 일반적으로 비즈니스 로직을 포함하는 레이어입니다. 데이터베이스에서 데이터를 가져오거나 변형하거나 다른 서비스를 호출하거나 다양한 애플리케이션의 비즈니스 로직을 구현하는 역할을 합니다. 즉, 서비스 레이어는 비즈니스 로직을 캡슐화하여 레포지토리와 컨트롤러 사이에 위치합니다. 이 레이어는 비즈니스 규칙과 워크플로를 수행하고, 데이터를 가져와 가공하는 일을 담당합니다. 예제 앞서 Repository에서 정의한 UserRepository를 사용하여 User에 대한 비즈니스 로직을 처리하는 UserService를 만들어봅시다. @Service public class UserService { private final UserRepository userR..

Repository

2023.07.12· Computer Science/디자인패턴

Repository - 데이터 접근에 대한 책임을 갖는다 레포지토리는 데이터에 접근하는 방법을 캡슐화하는데 사용되는 설계 패턴입니다. 레포지토리 패턴은 일관된 방식으로 데이터에 접근하도록 해주며, 도메인 로직에서 데이터 저장소의 세부 정보를 분리하여 응용 프로그램의 테스트 및 유지 관리를 용이하게 해줍니다. 예제 예를 들어, 사용자 데이터를 저장하는 경우를 생각해보겠습니다. 우리는 User라는 엔티티를 가지고 있고, 이를 데이터베이스에 저장하려고 합니다. 이를 위해 UserRepository 인터페이스를 정의하고 필요한 메소드를 선언할 수 있습니다. @Repository public interface UserRepository extends JpaRepository { User findByUsername..

🐥 카카오테크캠퍼스 - 2단계 3주차 과제 개요

2023.07.12· 프로젝트/카카오 테크 캠퍼스

🐥 카카오테크캠퍼스 - 2단계 3주차 - 과제 - 레포지토리 단위테스트 1. 레포지토리 단위테스트를 구현하여 소스코드를 제출하시오. 2. 쿼리를 테스트하면서 가장 좋은 쿼리를 작성해보시오. 핵심 지표 레포지토리 단위테스트가 구현되었는가? 테스트 메서드끼리 유기적으로 연결되지 않았는가? (테스트는 격리성이 필요하다) Persistene Context를 clear하여서 테스트가 구현되었는가 (더미데이터를 JPA를 이용해서 insert 할 예정인데, 레포지토리 테스트시에 영속화된 데이터 때문에 쿼리를 제대로 보지 못할 수 있기 때문에) 테스트 코드의 쿼리 관련된 메서드가 너무 많은 select를 유발하지 않는지? (적절한 한방쿼리, 효율적인 in query, N+1 문제 등이 해결된 쿼리) 🥔 내가 잘 모르는..

K - Means 알고리즘 실습

2023.07.12· AI

K - Means 알고리즘 실습 Intro 먼저 K-Means Clustering이 무엇인지, 그리고 어떤 실제 세계의 어플리케이션에서 사용되는지 살펴보겠습니다. K-Means는 군집화 모델 중 가장 단순한 모델 중 하나로, 그 단순함에도 불구하고 많은 데이터 과학 응용 프로그램에서 광범위하게 사용됩니다. 고객 세그멘테이션, 웹사이트 방문자의 행동 이해, 패턴 인식, 기계 학습, 데이터 압축 등에서 특히 유용하게 활용됩니다. 여기에서는 두 가지 예제를 통해 K-Means 클러스터링을 연습하게 될 것입니다. 무작위로 생성된 데이터셋에서의 K-Means 고객 세그멘테이션을 위한 K-Means 사용 1단계: 무작위 데이터셋 생성 먼저, 실습을 위한 데이터셋을 생성해 보겠습니다. 여기서는 numpy의 rando..

티스토리툴바