전체 글(63)
-
[DL] 음성 신호 모델링하는 방법, Wavenet 알아보기 - A Generative Model for Raw Audio
Wavenet은 음성 신호 Wave 자체를 모델링하여 음성을 생성하는 방법으로 2016년 구글 딥마인드에서 신경망을 이용하여 보다 자연스러운 TTS(Texts to Speech)를 개발한 것입니다. TTS란 텍스트를 음성으로 변환하는 것으로 오디오 북, 언어 교육 서비스, 외국어 더빙 등에 활용됩니다. TTS Wavenet이 나오기 전인 2015년 전통적인 TTS 모델들은 unit-selection speech synthesis 방법과 Statistical parameter speech synehesis 방법이 대표적이었습니다. unit-selection speech synthesis 방법은 방대한 양의 DB가 있다고 가정하고 어떤 기준(음소 정보)에 따라 데이터를 불러온 후 작게 쪼갠 데이터를 conc..
2020.11.13 -
[ML] 수식과 함께 SVM 이론 파헤치기
이번 글은 SVM에 대한 내용입니다. 이 강의는 순천향대학교 정영섭 교수님의 강의와 핸즈온 머신러닝을 참고하여 정리했음을 먼저 밝힙니다. 순서 1. SVM Motivation 2. 특징 3. 비선형 SVM 4.1. 수식으로 보는 SVM 4.2. Lagrangian multiplier method 4.3. Dual 문제로 변환 5. 장단점 1. SVM Motivation SVM은 Support Vector Machine의 줄임말입니다. 이 모델은 매우 강력하고 선형, 비선형 분류, 회귀, 이상치 탐색에 사용할 수 있습니다. 아래 그림에서 +,- 두 범주를 나누는 분류 문제를 푼다고 가정할 때 가장 잘 분류하는 선을 긋는다면 빨간색 선을 그을 수 있을 것입니다. 이렇게 두 범주를 나누는 선을 decision..
2020.11.12 -
[ML] 하나의 class만 학습시켜서 불균형 데이터 예측하기
Binary classification을 할 때 class의 데이터가 매우 불균형하거나 class에 한 개의 데이터만 있고 나머지 데이터가 없는 경우들이 있습니다. 이런 경우는 하나의 class만 학습시켜서 분류를 할 수 있는데 그 중 사용되는 방법 중 하나가 OCSVM입니다. OCSVM OCSVM은 One-class SVM의 줄임말로 SVM(Support vector machine)과 달리 비지도 학습(unsupervised learning)입니다. 주어진 데이터를 잘 설명할 수 있는 최적의 support vector를 구하고 이 영역 밖의 데이터들은 outlier로 간주하는 방식으로 이상치 탐지, 이미지 검색, 문서/ 텍스트 분류 등에 사용되었습니다. 위 그림과 같이 알고리즘은 초록색 원의 샘플 데이..
2020.11.12 -
[Algorithm] 힙(Heap)?
힙 힙이란 완전 이진 트리의 일종으로 우선순위 큐를 구현하기 위한 자료구조입니다. 여러 개의 값들 중 최댓값이나 최솟값을 빠르게 찾아내는데 사용됩니다. 이진 트리는 그림과 같이 트리 층에서 모든 노드가 최대 2개의 자식 노드를 가질 수 있는 구조를 말합니다. 이진트리는 왼쪽 자식과 오른쪽 자식을 구분한다는 특징이 있습니다. 우선순위 큐 우선순위 큐는 우선순위가 가장 높은 데이터를 먼저 삭제하는 자료구조를 말합니다. 우선순위 큐는 단순히 리스트를 이용하여 구현할 수도 있고 힙을 이용하여 구현할 수도 있습니다. 우선순위 큐를 단순히 리스트를 이용하여 구현하면 삽입하는 시간 복잡도는 O(1)이고 삭제할 때 시간 복잡도는 가장 우선순위가 높은 데이터를 찾기 위해 걸리는 시간이 포함되어 선형적인 탐색 시간이 소요..
2020.11.08 -
[git] git branch 확인이 안될 때
git을 이용하여 협업을 할 때는 branch를 이용한다. 이때 원격 저장소에 있는 branch를 로컬 저장소로 가져와야 하지만 다른 팀원이 만든 branch 또는 다른 PC로 만든 branch가 $ git branch 명령어를 사용했을 때 가져와지지 않을 때가 있다. 이때 $ git branch -r 을 이용하여 로컬 저장소의 branch를 확인하거나 $ git branch -a 를 이용하여 로컬 저장소와 원격 저장소 모두에 있는 branch를 확인할 수 있다. 원하는 branch를 가져오고 싶다면 $ git checkout -t [브랜치 이름] 을 이용하여 가져올 수 있다.
2020.11.04 -
[시계열 분석] 01. 시계열 데이터 어떻게 예측하는가?
이번 글은 시계열 데이터를 분석하는 방법에 대해 알아보겠습니다. 시계열 데이터? 시계열 데이터는 주식가격, 실업률, 기후 데이터처럼 관측치가 시간적 순서를 가진 데이터를 말합니다. 시계열 변동요인 시계열 변동요인에는 4가지 요인들이 있습니다. 추세요인: 장기간&점진적으로 상승하거나 하강 순환요인: 수년간의 간격으로 주기적인 패턴 파악 계절요인: 단기적이고 주기적인 패턴을 갖고 반복적인 경향 불규칙요인: 명확히 설명할 수 없는 요인에 의한 우연변동 시계열 자료분석 순서 시계열 데이터를 분석할 때 순서는 다음과 같습니다. 시계열 데이터 구조 파악 시계열 데이터의 구조와 특성을 토대로 미래 값 예측 ARIMA 모형은 정상성 데이터로만 미래의 값 예측 가능 정상성의 기준 모든 시점에 대해 일정한 평균을 가짐. ..
2020.10.30