人間の話す音声をテキストに変換するタスクは?
- 音声認識
- 音声合成
- 話者識別
- 感情分析
正解!
不正解...
正解は音声認識です。
問題に戻る
テキストから音声を生成するタスクは?
- 音声合成
- 感情分析
- 音韻変換
- 音素変換
正解!
不正解...
正解は音声合成です。
音声合成は、テキストから音声を生成するタスクで、ナビや読み上げなどに利用されます。
問題に戻る
音声の特徴から「誰が話したか」を特定するタスクは?
- 話者識別
- 音声合成
- 音声認識
- 音韻解析
正解!
不正解...
正解は話者識別です。
話者識別は、誰が話したかを特定するタスクです。
問題に戻る
音声処理で代表的な特徴量である、メル周波数ケプストラム係数の略称は?
- FFT
- MFCC
- BoW
- TF-IDF
正解!
不正解...
正解はMFCCです。
MFCC(メル周波数ケプストラム係数)は、音声の特徴量としてよく使われます。
問題に戻る
人間の聴覚に合わせた音の高さのスケールは?
- メル尺度
- フォルマント
- BoW
- スペクトル包絡
正解!
不正解...
正解はメル尺度です。
メル尺度は、人間の聴覚特性に基づいて音の高さを表現するスケールです。
問題に戻る
音声認識において時間とラベルの整合をとる損失関数は?
- CTC
- RNN
- CNN
- GAN
正解!
不正解...
正解はCTCです。
CTC(Connectionist Temporal Classification)は、音声認識においてラベルと音声の時間整合を取る手法です。
問題に戻る
音声合成の高品質モデルとして知られる生成モデルは?
- WaveNet
- fastText
- VGG
- ResNet
正解!
不正解...
正解はWaveNetです。
WaveNetは、高品質な音声合成のための生成モデルです。
問題に戻る
音声信号における共鳴周波数のことを何という?
- フォルマント
- 音素
- トークン
- ビット
正解!
不正解...
正解はフォルマントです。
フォルマントは母音などの音声信号における共鳴周波数で、音の特徴を決定づけます。
問題に戻る
アナログ音声をデジタル信号に変換する方式は?
- PCM
- FFT
- MFCC
- TF-IDF
正解!
不正解...
正解はPCMです。
PCM(パルス符号変調)はアナログ音声をデジタルに変換する方式の1つです。
問題に戻る
音声信号を周波数に分解するために使われる変換手法は?
- FFT
- 単語埋め込み
- BoW
- Word2Vec
正解!
不正解...
正解はFFTです。
FFT(高速フーリエ変換)は、音声信号を周波数成分に変換する手法です。
問題に戻る
音声認識は、人間の話す音声をテキストに変換するタスクです。