인공지능 4

[머신러닝 - 이론] 데이터의 종류, 성능 측정 (Type of data, Performance Measurement)

1. 데이터의 종류, 분별력 앞의 iris 데이터에서 특징은 총 4개가 있었습니다. 이때 특징을 4차원 공간에서 보면, 레이블에 따라 몇몇 데이터는 뭉쳐져 있고, 몇몇 데이터는 떨어져 있는 것을 알 수 있습니다. 물론 4차원 공간을 볼 순 없지만, 3차원 공간으로는 볼 수 있습니다. 이때 특징에 따라 같은 레이블이 뭉쳐져 있고, 다른 레이블과의 거리가 멀다면 이 특징은 분별력 (descriminating power)이 뛰어나다고 볼 수 있습니다. 이때 다차원의 특징은 거리를 바탕으로 계산합니다. 또 다른 데이터로는 영상 데이터가 있습니다. 대표적으로 MNIST라는 숫자를 필기한 데이터가 있습니다. 이때는 화소 값이 특징 벡터입니다. 또 다른 영상 데이터는 얼굴 데이터셋이 있습니다. 어떤 데이터가 있으면 ..

[머신러닝 - 이론] 머신러닝의 기초 (Fundamental of Machine Learning)

1. 머신러닝 기초 머신러닝에서 데이터는 중요합니다. 차가 가기 위해 연료가 필요하듯 머신러닝에는 데이터가 필수적입니다. 데이터가 없으면 머신러닝을 적용할 수가 없습니다. 아무것도 가르쳐 주지 않고, 예측하라는 것과 마찬가지입니다. 2. 용어 및 예시 데이터 셋 (Data Set) : 머신러닝이 사용하는 데이터는 여러 개의 샘플을 담고 있어서 데이터 셋이라 부릅니다. 특징 벡터 (feature vector) : 데이터의 특징으로 구성되는 특징들의 집합입니다. 부류 (class) : 쉽게 설명해서 꽃의 종류입니다. 특징으로는 색깔, 길이 등등이 있고, 이 특징들을 바탕으로 부류가 정해집니다. 머신러닝이 예측하는 값입니다. 사이킷런에서 제공하는 iris 데이터 셋을 한 번 확인해봅시다. from sklear..

[머신러닝 - 이론] 인공지능이란? (What is artificial intelligence?)

들어가기에 앞서서 머신러닝의 대다수의 글은 코드 보다는 수학적 이론, 설명 위주로 할 예정입니다. 저는 원래 설명 - 수학적 이론 - 코드 방식으로 공부하는 bottom-up 방식을 매우 좋아합니다. 하지만 시간이 별로 없어서,,나중에 시간이 된다면 코드를 올리겠습니다. 중간중간 수학적인 수식이 나오지만, 좀 더 중점적으로 설명 위주로 할 겁니다. 마지막에는 설명을 바탕으로 코드를 구현한 글도 올릴 예정입니다. 1. 인공지능에 대한 정의 지능 : 계산이나 문장 따위의 지적 작업에서, 성취 정도에 따라 정하여지는 적응 능력 인공지능 : 인간의 지능이 가지는 학습, 추리, 적응, 논증 따위의 기능을 갖춘 컴퓨터 시스템 강한 인공지능 vs 약한 인공지능 강한 인공지능 다양한 지능의 복합체 (터미네이터에 등장하..

[Jupyter Notebook] 주피터 노트북 설치 (window)

22.11.24 수정 및 추가 아나콘다(Linux) 2022.11.24 - [인공지능 (Artificial Intelligence, AI)/Anaconda] - [Anaconda] Anaconda 설치 (Linux) [Anaconda] Anaconda 설치 (Linux) 1. Anaconda란? 아나콘다(Anaconda)는 패키지 관리와 배포를 단순히 할 목적으로 과학 계산을 위한 파이썬과 R 프로그래밍 언어의 배포판입니다. 패키지 버전들은 패키지 관리 시스템 conda를 통해 관리 hi-guten-tag.tistory.com 주피터 노트북 사용법 2022.11.24 - [인공지능 (Artificial Intelligence, AI)/Anaconda] - [Jupyter Notebook] 주피터 노트북 ..