ITパスポート試験 用語辞典
畳み込みニューラルネットワーク
ver6.2
【Convolutional Neural Network】
ディープラーニングモデルのうち、畳み込み層とプーリング層をもつ深層学習モデルのこと。特に画像認識分野で高い性能を示すモデルとして知られている。画像の区分ごとの特徴を抽出する畳み込み層、得られた特徴を集約・固定しデータサイズを小さくするプーリング層、畳み込み層とプーリング層を交互に複数回繰り返した後、抽出された特徴をもとに予測・分類を行う全結合層から構成される。
入力された画像などのデータは、各座標における色・形状・境界などの情報を表す関数が設定され、その値に対し特徴を抽出するための行列を用いた演算式で処理が行われる。このとき用いられる演算式は学習によって得られ、カーネルまたはフィルタと呼ばれる。カーネルによる特徴抽出は、対象座標とその周囲座標における値と、奇数×奇数の正方行列で示されるカーネルとの演算によって行われ、抽出された1つの結果がプーリング層に受け渡される。この過程を畳み込み(convolution)と呼び、画像などのデータ全体に対し1ずつ座標をスライドさせながら畳み込み処理を行う。
プーリング層では畳み込み層で得られたデータに対し、ウィンドウと呼ばれる区切られた範囲をスライドさせながら、範囲内の最大値や平均を取るなどの処理を行い、重要な情報を保持しつつデータサイズを小さくしていく。そして全結合層では畳み込み層とプーリング層によって得られた特徴をもとに最終的な予測、分類などの結果を出力する。畳み込みニューラルネットワークは画像だけでなく、周波数などの特徴をもとに音声認識にも利用されており、野外録音音声からの動物の鳴き声検出、呼吸器疾患診断のための呼吸音分類などの研究がなされている。
入力された画像などのデータは、各座標における色・形状・境界などの情報を表す関数が設定され、その値に対し特徴を抽出するための行列を用いた演算式で処理が行われる。このとき用いられる演算式は学習によって得られ、カーネルまたはフィルタと呼ばれる。カーネルによる特徴抽出は、対象座標とその周囲座標における値と、奇数×奇数の正方行列で示されるカーネルとの演算によって行われ、抽出された1つの結果がプーリング層に受け渡される。この過程を畳み込み(convolution)と呼び、画像などのデータ全体に対し1ずつ座標をスライドさせながら畳み込み処理を行う。
プーリング層では畳み込み層で得られたデータに対し、ウィンドウと呼ばれる区切られた範囲をスライドさせながら、範囲内の最大値や平均を取るなどの処理を行い、重要な情報を保持しつつデータサイズを小さくしていく。そして全結合層では畳み込み層とプーリング層によって得られた特徴をもとに最終的な予測、分類などの結果を出力する。畳み込みニューラルネットワークは画像だけでなく、周波数などの特徴をもとに音声認識にも利用されており、野外録音音声からの動物の鳴き声検出、呼吸器疾患診断のための呼吸音分類などの研究がなされている。
↓ 用語データを見る
- 別名:
- CNN
- 分野:
- 分野:テクノロジ系
中分類:基礎理論
小分類:情報に関する理論 - 重要度:
- ★★★
広告
「情報に関する理論」の用語
「基礎理論」の他の分野
「テクノロジ系」の他のカテゴリ
広告