入力側に近い特徴抽出層を工夫すると認識性能が改善することが多いです.今回は特徴抽出層に Temporal CNN を導入して性能改善を試みます.
実践手話認識の記事一覧
-
-
実践手話認識 - モデル開発編 補足: Pydanticを用いてTransformerベース孤立手話単語認識モデルをリファクタリング
作成日: 2024年10月24日(木) 00:00
最終更新日: 2024年10月25日(金) 10:14
Pydanticを用いてTransformerベースの孤立手話単語認識モデルをリファクタリングしましたので,実装コードを紹介します.
-
実践手話認識 - モデル開発編 補足: Pydanticを用いてNNモデルのハイパーパラメータをまとめる方法
作成日: 2024年10月10日(木) 00:00
最終更新日: 2024年10月19日(土) 18:16
Pydanticを用いてハイパーパラメータをまとめることで,NNモデルのインターフェースをシンプルにする方法を紹介します.
-
実践手話認識 - モデル開発編5: Transformer Encoder-Decoderを用いた連続指文字認識モデル
作成日: 2024年09月24日(火) 00:00
最終更新日: 2024年10月08日(火) 14:25
Transformer Encoder-Decoder を用いた連続指文字認識モデルを紹介します.題材は連続指文字認識ですが,手法は連続手話単語認識や手話翻訳にも応用可能です.
-
実践手話認識 - モデル開発編 補足: Transformer の Multi-head cross-attentionの処理について
作成日: 2024年09月24日(火) 00:00
最終更新日: 2024年10月08日(火) 14:22
Transformer の補足説明として,Multi-head cross attention の処理について紹介します.