Cluster2

less than 1 minute read


4.군집화 image

4.군집화 image

일반군집화 -> 딱딱 나뉨, 퍼지군집화 -> 데이터가 양다리 새다리씩 걸침

아웃라이어 -> 중심에서 얼마나 떨어진 값이냐

얼마나 군집을 잘했는가 판단하는 기준은 각 군집간 거리가 얼마나 먼지, 멀면 멀수록 좋은 군집이다.

4.군집화 image

데이터의 분포를 잘 맞추는게 중요하다.

이 데이터를 알고있다 -> 이 데이터의 분포를 알고있다 -> 이 데이터가 들어갔을때 output 값을 알고있다 는 의미로 연결된다

밀도 : 주어진 위치에서 얼마나 데이터가 모여있느냐?

4.군집화 image

밀도추정의 방법은 다음과 같이 새가지가 있다.

모수적 -> 가정하고 ㄱㄱ , 비모수적 -> 가정안하고 ㄱㄱ

4.군집화 image

차원축소는 고차원의 데이터 -> 저차원의 데이터 로 변환하는 것이다

얼굴 3d모델을 표현했을땐 저런식으로 표현할 수 있다.

4.군집화 image

4.군집화 image

차원의 저주는 차원이 커질수록 x값에 대한 y값의 차이들이 점점 줄어드는 걸 말한다 -> 데이터간의 식별하기가 점점 힘들어진다

4.군집화 image

4.군집화 image

4.군집화 image

아주 중요하다!! 뒤에서도 나온다

아웃 라이어 : 좀 튀는새끼들 아웃라이어는 부정사용감지 시스템, 침입탐지 시스템을 이용해서 탐지한다

4.군집화 image

탐지의 종류는 정상을 학습하고 비정상을 탐지하면 anomaly, 비정상을 학습하고 이와 같음을 비교하면 misuse 정사이 너무 적으면 misuse를 이용해 판단할 수도 있다. 대부분의 실질적인 바이러스는 misuse를 이용해 판단한다고 한다.

4.군집화 image

반지도 학습은 미분류 데이터를 지도학습하는 방법 , 같은 군집에 속하는건 동일한 부류에 소속하도록 학습한다.

4.군집화 image

한번 보고 넘어가기

Updated: