「刺身たんぽぽ同好会」のメンバーによるアドベントカレンダーA.A2日目です.
30分で論文読むやつです.(専門は言語処理です)
CYCLETRANSGAN-EVC: A CYCLEGAN-BASED EMOTIONAL VOICE CONVERSIONMODEL WITH TRANSFORMER
Author: 著者,所属
Motivation: 研究の出発点
Method: 研究手法
Cycle GANにtransformerモデルを組み合わせたCycleTransGANを提案
F0とスペクトルグラムを特徴料とする(Zhou et al. [13],Ming et al. [20], and Kaneko et al. [21])
スペクトログラム
F0はスペクトログラムと比べ情報量が少ない
だから*2されていない
入力の感情情報をターゲットのものと一致させる
元の言語情報を保持したまま入力を変換する
ジェネレータが目標とする分布に従っているかどうかを判断
カリキュラム学習を用いてフレームの長さを段階的に増やした
日本語感情音声データセットで評価
Insight: 結果と知見
カリキュラム学習を用いることで,短いセグメントから全体を学習でき,感情の特徴変換がうまくいった
時間的特徴量によ裏,誤読,音素のスキップなどの不安定な問題をある程度解決
感情の類似性,声質,自然さで向上した
(One-sentence) Contribution Summary: 貢献を1行でまとめる
Keyword: キーワード
Unknown: 残った課題
Reflection: 考察
Reference:読むべき 関連研究