2024/10/16 3

머신러닝 이진분류 와 다중분류 유방암데이터 와 붗꽃데이터 다중분류

■ 이진분류는 머신러닝에서 데이터를 2 개의 클래스로 나누는 작업을 의미이 과정에서 각 데이터 포인트가 특정 클래스에 속하는지 여부를 예측합니다.    일반적으로 " True" 클래스와, False  클래스로 나누어진다.이진분류 예시 스팸 이메일 분류 : 이메일이 스팸인지 아닌지를 분류질변진단 : 환자가 특정 질병에 걸렸는지 여부를 판단고객이탈예측 : 고객이 서비스를 계속 이용할 것인지 아닌지 예측 ■ 다중분류는 머신러닝에서 데이터를 3 개 이상의 클래스로 나누는 작업을 의미각 데이터 포인트가 여러 클래스 중 하나에 속하는지를 예측하는 과정.다중분류 예시이미지분류 : 다양한 동물(고양이,개,새 등)을 분류하는 작업.스팸분류  : 이메일이 스팸, 일반, 홍보, 이메일 등으로 나뉘는 경우.텍스트분류: 뉴스 ..

머신러닝2일차 (연습) 몸무게와 키를 보고 여자인지 남자인지 확인해보자!

#  몸무게와 키를 보고 여자인지 남자인지 확인해보자!#  남자 5명  여자 5명사람키 = [180, 190, 175, 181, 182, 168, 170, 158, 160, 150]사람무게 = [75, 90, 68, 72, 73, 50, 58, 52, 48, 45]사람특성 = [[키,무게]for 키, 무게 in zip(사람키,사람무게)]사람정답 = [1, 1, 1, 1, 1, 0, 0, 0, 0, 0 ]from sklearn.neighbors import KNeighborsClassifier# 학습 시에 특성은 2차원 리스트, 타겟은 1차원 리스트이다!최근접이웃모델 = KNeighborsClassifier()최근접이웃모델.fit(사람특성, 사람정답)# fit() 데이터 2차원 리스트여야한다# target..

머신러닝 2일차.2024.10.14.

1.★ 데이터 준비    필요하다면 전처리 하기!    결손값 처리, 누락값이 있으면 없애든지 다른값으로대체한다.    or 이상치를 제거한다.    # 중복되는 데이터가 많은면 없애는 것을 전처리 라고 함    # 데이터가 많을수록 정확도가 높아진다.    # 이중분류 : 2개중 하나를 고르는 것    # 다중분류 : 3개 이상중 하나를 고르는 것    # KNN 최근접 이웃 알고리즘 (K-최근접 이웃)    # 어떤 데이터가 있을때 최고 가까운 애들을 확인해서 가까운 나또한 애들 일 것 이다    # 사이킷런? (sckiet-learn) 머신러닝 패키지 / 2차원 리스트를 만들어야 사용 가능하다    # 피처 특성1나당 피처 ex 길이 , 무게      # 타겟 : 답을 설정 ex [1],[0] 설정..