Transformer Encoder-Decoder を用いた連続指文字認識モデルを紹介します.題材は連続指文字認識ですが,手法は連続手話単語認識や手話翻訳にも応用可能です.
2024年9月の記事一覧
-
実践手話認識 - モデル開発編5: Transformer Encoder-Decoderを用いた連続指文字認識モデル
作成日: 2024年09月24日(火) 00:00
最終更新日: 2024年10月08日(火) 14:25
-
実践手話認識 - モデル開発編 補足: Transformer の Multi-head cross-attentionの処理について
作成日: 2024年09月24日(火) 00:00
最終更新日: 2024年10月08日(火) 14:22
Transformer の補足説明として,Multi-head cross attention の処理について紹介します.
-
特殊記号が入っている文字列を一括で変更する Linux コマンド (grep + xargs + sed)
作成日: 2024年09月18日(水) 00:00
最終更新日: 2024年09月18日(水) 18:02
"/" などの特殊記号が入っている文字列を一括で置き換えるのに少し苦労しましたので,備忘録として残しておきます.
-
実践手話認識 - モデル開発編4: RNN Encoder-Decoderを用いた連続指文字認識モデル
作成日: 2024年09月13日(金) 00:00
最終更新日: 2024年10月08日(火) 14:25
RNN Encoder-Decoderを用いた連続指文字認識モデルを紹介します.題材は連続指文字認識ですが,手法は連続手話単語認識や手話翻訳にも応用可能です.
-
実践手話認識 - モデル開発編3: Encoder-Decoder を用いた時系列認識の処理
作成日: 2024年09月12日(木) 00:00
最終更新日: 2024年10月08日(火) 14:15
Encoder-Decoder を用いた時系列認識の処理について説明します.今回はモデルではなく学習ループなどの全体的な処理の実装例を示します.
-
実践手話認識 - モデル開発編 補足: 時系列認識における Loss 計算のハマりどころ
作成日: 2024年09月12日(木) 00:00
最終更新日: 2024年10月08日(火) 14:00
Encoder-Decoder を用いて Loss 計算を行う際のハマりどころについて説明します.
-
実践手話認識 - モデル開発編 補足: Word error rate について
作成日: 2024年09月12日(木) 00:00
最終更新日: 2024年09月18日(水) 09:47
時系列認識の評価によく用いられる,単語誤り率 (Word error rate) について簡単に説明します.
-
Google American Sign Language Fingerspelling Recognitionのデータセットについて解説します
作成日: 2024年09月08日(日) 00:00
最終更新日: 2024年10月08日(火) 13:44
Google American Sign Language Fingerspelling Recognitionで配布される,連続指文字認識用データセットについて解説します.
-
実践手話認識 - モデル開発編 補足: Conformer の Convolution module について
作成日: 2024年09月04日(水) 00:00
最終更新日: 2024年10月08日(火) 13:40
Conformer の Convolution module をもう少し細かく説明します.なお,Convolution module をいじって追加実験してみましたが,結果としては全く改善しませんでした (^^;).