入力側に近い特徴抽出層を工夫すると認識性能が改善することが多いです.今回は特徴抽出層に Temporal CNN を導入して性能改善を試みます.

入力側に近い特徴抽出層を工夫すると認識性能が改善することが多いです.今回は特徴抽出層に Temporal CNN を導入して性能改善を試みます.
Pydanticを用いてTransformerベースの孤立手話単語認識モデルをリファクタリングしましたので,実装コードを紹介します.
Pydanticを用いてハイパーパラメータをまとめることで,NNモデルのインターフェースをシンプルにする方法を紹介します.
Transformer Encoder-Decoder を用いた連続指文字認識モデルを紹介します.題材は連続指文字認識ですが,手法は連続手話単語認識や手話翻訳にも応用可能です.
Transformer の補足説明として,Multi-head cross attention の処理について紹介します.
2024年10月 (3) |
2024年09月 (7) |
2024年08月 (3) |