Post by Category

딥러닝

ViVIT

7 minute read

ViVIT: A Video Vision Transformer

VIT

4 minute read

ViT

음성합성 With DeepLearning

4 minute read

Speech Synthesis - With Deep learning Introduction HMM 의 구조는, Input 이 들어오면 Cluster Sequence 로 바꾸고 해당 시퀀스를 피처 시퀀스로 바꾸는 과정이 진행된다. 그림 1.HMM의 Step ...

Audio Deep Learning- 푸리에 변환

10 minute read

Audio Deep Learning - 푸리에 변환 소리란? 진동으로 인한 공기의 압축이다. 소리에서 얻을 수 있는 물리량 Amplitude : 진폭 Frequency : 주파수 Phase : 위상 물리 음향의 경우 진폭의 세기, 소리 떨림의 바르기, 소리파...

Source Filter Model

4 minute read

Source Filter Model Introduction Speech 의 생성 과정은 생각 -> 문장합성 -> 조음기관을 통해 발화 -> 공기를 통해 전파 -> 음성이 이해 식으로 진행된다 음성 생성의 경우 폐로부터 만들어진 공기가 성대를 통과하여 주...

Hidden Markov Model

9 minute read

Hidden Markov Model 순차 데이터란 시간적 특성이 있는 데이터라고 할 수 있다. 예를 들어 어떤 염기서열, 날씨, 음성 등등이 이러한 Sequence 데이터라고 할 수 있다. HMM 은 순차 데이터를 확률적으로 모델링하는 생성 모델이라고 할 수 있다 (Genera...

Seq2Seq

10 minute read

Seq2Seq: Sequence to Sequence Learning with Neural Networks 들어가기 앞서 Convolutional Neural-Network 구조에서의 핵심은 이미지를 잘 학습 시키기 위해 기존 이미지에서 얻을 수 있는 공간적 특성을 Featur...

ResNet&DenseNet

10 minute read

ResNet & DenseNet 들어가기 앞서 앞선 게시물에서 CNN에 대한 기본적인 구조를 살펴보았다. 이미지 인식 분야에서는 ImageNet Challenge 라는 대회가 있는데 이 곳에서는 여러가지 모델들이 실험되며 경연을 통해 우승 모델들이 결정된다. ...

CNN(Convolutional Neural Network)

9 minute read

CNN(Convolutional Neural Network) 들어가기 앞서 기본적으로 딥러닝을 배울 때 우리는 단층 퍼셉트론, 다층 퍼셉트론에서 어떻게 학습이 이루어지는지에 대해 배웠고 또한 어떻게 학습을 잘 할 수 있는지에 대한 알고리즘, 최적화 기법, 초기화 기법 등을 공부...

BACK-PROPAGATION

8 minute read

개요 우리는 앞서 단일 퍼셉트론의 한계와 다층 퍼셉트론에서 비선형 분류를 수행하는 과정에 대해서 알아봤다. 그 과정에서 우리는 Feed Forward 방식으로 output을 내보내는데, 여기서 우리는 실제 출력 값과 오차에 대한 Cost Function 을 계산할 수 있다. ...

Back to top ↑

머신러닝

SVM

8 minute read

SVM(support vector machine)

분류(Classification)

5 minute read

분류(Classification) Introduction 머신러닝 & 딥러닝 분야에서 분류는 가장 일반적인 Task 중 하나이다. 객체를 분류한다던지 이미지를 분류한다던지 분류의 종류는 매우 많으며 다양하다고 할 수 있다. 예를 들어 강아지와 고양이를 분류하는 모델을...

정규화모델

8 minute read

좋은 모델은 무엇일까? 현재 데이터(training data)를 잘 설명하는 모델 Explanatory modeling 미래 데이터(testing data)에 대한 예측 성능이 좋은 모델 Predictive modeling 좋은 모델은 현재 데이터를 잘 설명하며 미...

Back to top ↑

기초통계

경사하강법

6 minute read

Gradient Descent의 목적 gradient descent는 기본적으로 함수의 최솟값을 찾는 것이 목적이다. “”선형회귀에서 정규방정식을 만족하는 해를 찾는 것처럼 해석적인 방법을 이용하면 되지 않겠느냐?” 라는 물음은 자연스러운 물음이다. 하지만 데이...

선형회귀

4 minute read

어디서 출발하는가 Machine Learning 은 어떤 목적을 가질까? 그림 1.머신러닝의 접근법 위 그림은 머신러닝의 기본적인 접근법이다. input과 output을 보고 적당한 모델을 만드는데, 회귀분석도 대표적인 머신러닝의 방법이라고 할 수 있다. ...

로지스틱회귀

5 minute read

Logistic Regression이란? 보통 설명변수와 반응변수의 관계를 생각할 때, 선형회귀 알고리즘에 익숙한 우리는 반응변수 $Y$ 를 수치형으로 생각한다. 하지만 만약 출력값인 $Y$​가 범주형이라면 우리는 입력값 $X$​를 넣어 여러 클래스 중 알맞은 클래스로 $Y$​...

Back to top ↑

Speech Synthesis - Without Deep learning

3 minute read

Speech Synthesis - Without Deep learning Introduction Text 가 입력일 때 그 것을 Speech로 바꾸어 주는 것이다. 이 음성합성의 목적은 크게 두가지가 있다. Intelligibility : 얼마나 음성이 또박또박 발음되...

Attention

4 minute read

Attention 들어가기 앞서 우리는 앞서 Seq2Seq 모델에 대해서 살펴보았다. 그림 1. Seq2Seq 구조 다시 복기하자면, Seq2Seq 모델은 위와 같이 Encoder 와 Decoder 의 구조를 띄고 있다. 기존 RNN 셀을 이어붙인 모델들...

Back to top ↑

Speech Synthesis - Without Deep learning

3 minute read

Speech Synthesis - Without Deep learning Introduction Text 가 입력일 때 그 것을 Speech로 바꾸어 주는 것이다. 이 음성합성의 목적은 크게 두가지가 있다. Intelligibility : 얼마나 음성이 또박또박 발음되...

Attention

4 minute read

Attention 들어가기 앞서 우리는 앞서 Seq2Seq 모델에 대해서 살펴보았다. 그림 1. Seq2Seq 구조 다시 복기하자면, Seq2Seq 모델은 위와 같이 Encoder 와 Decoder 의 구조를 띄고 있다. 기존 RNN 셀을 이어붙인 모델들...

Back to top ↑

Transformer

10 minute read

Transformer:Attention is all you need 게시글 그림에 대한 출처는 1) 트랜스포머(Transformer) - 딥 러닝을 이용한 자연어 처리 입문 (wikidocs.net) 에서 참고하였습니다. 들어가기 앞서 우리는 앞서 Seq2Seq 기법에 Att...

Back to top ↑

음성합성

Audio Deep Learning- 푸리에 변환

10 minute read

Audio Deep Learning - 푸리에 변환 소리란? 진동으로 인한 공기의 압축이다. 소리에서 얻을 수 있는 물리량 Amplitude : 진폭 Frequency : 주파수 Phase : 위상 물리 음향의 경우 진폭의 세기, 소리 떨림의 바르기, 소리파...

Back to top ↑

통계학

Back to top ↑