본문 바로가기
카테고리 없음

인공지능 다양한 기계 학습 과제

by 타로101 2024. 3. 12.

기계 학습 알고리즘은 데이터로부터 학습하는데, 학습은 어떤 과제를 수행하고 그 성과를 측정하는 과정에서 경험에 의해 개선되는 것을 의미한다. 경험, 과제, 성과 측도는 응용문제에 따라 다양하게 정의될 수 있습니다.

 

인공지능
인공지능

 

기계 학습을 통한 과제 해결

기계 학습을 통해 사람이 작성한 고정된 프로그램으로는 어려운 과제를 해결할 수 있습니다. 이는 과학과 철학적으로도 흥미롭습니다. 학습 과정은 과제를 수행하기 위한 수단으로, 기계 학습 시스템의 처리 방식을 설명하는 과제의 비교적 공식적인 정의가 있습니다. 보기는 기계 학습 시스템이 처리하는 대상으로, 일반적으로 벡터 형태로 표현됩니다. 이러한 학습을 통해 다양한 과제를 해결할 수 있습니다.

 

분류(classification) 과제

분류(classification) 과제에서 컴퓨터 프로그램은 주어진 입력이 k개의 범주 중 어떤 범주에 속하는지 결정합니다. 일반적으로 이를 위해 학습 알고리즘은 함수를 만듭니다. 예를 들어, 함수 y=f(x)는 하나의 입력 벡터를 한 범주에 대응시킵니다. 이와 유사한 변형된 분류 과제도 있으며, 예를 들어 함수 f가 클래스들에 대한 확률 분포를 산출할 수도 있습니다. 분류 과제의 좋은 예로는 물체 인식이 있습니다. 이 경우 입력은 이미지이고, 출력은 물체의 종류를 나타내는 수치 부호입니다. 이러한 기술을 이용하면 컴퓨터가 사진 앨범에서 사람을 자동으로 인식하거나 사용자와 자연스럽게 상호작용할 수 있습니다.

 

결측 입력 처리의 어려움

결측 입력이 있는 자료의 분류는 일반적인 분류보다 어려운 문제입니다. 보통의 경우 입력의 모든 측면이 주어진다고 가정하지만, 결측 입력이 있을 때는 여러 분류 함수의 집합을 학습해야 합니다. 이러한 집합의 각 함수는 입력의 서로 다른 결측값들의 부분집합으로 분류합니다. 이런 상황은 의료 진단에서 흔히 발생합니다. 이를 해결하기 위해 하나의 함수를 배우는 대신, 모든 관련 변수에 대한 확률 분포를 학습하고 결측값을 주변 화하여 분류 문제를 해결할 수 있습니다. 이 경우 가능한 결측 입력 구성에 대응되는 모든 분류 함수를 구하는 대신, 하나의 결합 확률 분포 함수만을 학습하면 됩니다.

 

회귀(regression) 과제

회귀(regression)는 주어진 입력에 기반하여 하나의 수치를 예측하는 과제입니다. 이를 위해 학습 알고리즘이 배워야 하는 것은 하나의 함수입니다. 분류 과제와 유사하지만 형태가 다릅니다. 예를 들어, 보험 가입자의 보험금이나 향후 주식 가격을 예측하는 것이 회귀 과제의 예시입니다. 이러한 예측은 주식 거래 프로그램에도 사용될 수 있습니다.

 

전사(transcription) 과제

전사(transcription) 과제에서 기계 학습 시스템은 구조적이지 않은 형태의 자료를 입력으로 받아서 해당 정보를 이산적인 텍스트 형식으로 출력해야 합니다. 예를 들어 OCR 프로그램은 이미지에서 텍스트를 추출하고, Google 스트리트 뷰는 건물 번지수를 인식하는 데 이를 사용합니다. 또한 음성 인식은 입력된 음향 파형에서 단어를 식별하여 해당 문자열이나 단어 ID를 출력합니다.

 

비정상 검출(anomaly detection) 과제

비정상 검출(anomaly detection) 과제에서 컴퓨터 프로그램은 사건이나 물체를 분석하여 특이하거나 비정상적인 것을 찾아냅니다. 신용카드 사기 검출은 이러한 과제의 예시입니다. 신용카드 회사는 사용자의 결제 습관을 모델링하여, 비정상적인 거래를 감지합니다. 예를 들어, 사용자의 일반적인 구매 패턴과 다른 거래가 발생하면, 신용카드 회사는 해당 계정을 즉시 잠금 처리하여 사기 행위를 방지합니다.

 

합성과 표본추출 과제

합성과 표본추출은 기계 학습 알고리즘이 훈련 데이터와 비슷한 새로운 샘플을 생성하는 과제입니다. 매체 관련 응용에서, 사람이 수작업으로 생성하는 것이 너무 비용이 많이 들거나 지루하거나 시간이 너무 많이 걸릴 때 유용합니다. 예를 들어, 비디오 게임에서 큰 물체나 지형에 사용할 텍스처를 컴퓨터를 사용하여 자동으로 생성할 수 있습니다. 때로는 특정 종류의 출력을 생성하기 위해 합성 또는 표본추출을 사용합니다. 예를 들어, 음성합성 과제에서 주어진 문자열에 해당하는 음성을 생성할 수 있습니다. 이러한 과제는 구조적 출력 과제의 한 유형이며, 각 입력에 대해 정확한 출력이 정해져 있지 않으며, 보다 자연스럽고 다양한 결과를 얻기 위해 출력의 다양성이 중요합니다.

 

확률밀도 추정 과제

확률밀도 추정 또는 확률질량함수 추정 과제에서 기계 학습 알고리즘은 주어진 데이터의 구조를 학습하여 함수를 배워야 합니다. 이러한 모델은 데이터 공간에서 밀도 함수 또는 확률 질량 함수로 해석될 수 있습니다. 이를 위해 알고리즘은 데이터의 패턴을 파악하여 밀집된 지역과 드물게 나타나는 지역을 이해해야 합니다. 대부분의 경우, 학습 알고리즘은 확률 분포의 구조를 파악하여 다른 작업을 수행할 수 있어야 합니다. 예를 들어, 확률 분포의 밀도를 추정한 후에는 결측값을 대체하는 과제를 해결하는 데 사용할 수 있습니다.

 

구조적 출력 과제

구조적 출력 과제는 출력이 하나의 벡터이며 벡터의 성분들 사이에 중요한 관계가 있는 모든 과제를 포함합니다. 이러한 과제는 구문 분석과 이미지 픽셀 분할과 같은 다양한 작업을 포함하며, 이러한 출력은 입력의 구조를 반영할 필요가 없습니다. 예를 들어, 구문 분석은 주어진 자연어 문장의 구조를 나타내는 트리를 형성하고, 이미지 픽셀 분할은 각 픽셀에 범주를 할당합니다. 구조적 출력 과제는 컴퓨터 프로그램의 출력이 서로 관련된 여러 값으로 이루어진 자료구조일 때 사용됩니다.

 

결론

기계 학습 알고리즘은 다양한 응용문제에 적용될 수 있으며, 이를 통해 주어진 과제를 해결하기 위한 함수를 학습합니다. 이러한 과제에는 분류, 회귀, 전사, 비정상 검출, 합성 및 표본추출, 확률밀도 추정, 그리고 구조적 출력이 포함됩니다. 이러한 다양한 기법을 통해 기계 학습은 실제 세계의 복잡한 문제를 효과적으로 해결할 수 있습니다.