- 1 : 2024/02/08(木) 22:59:14.50 ID:RxO0nQRL
-
立教大、フーリエ変換を用いて大量のメモリが不要な画像認識の新手法を開発
立教大学は2月6日、音声や画像のような信号を異なる周波数の成分に分解する数学的手法「フーリエ変換」を用いて、「グローバルフィルタ」と「注意機構」のメリットを兼ね備えた、大量のメモリを必要としない新しい画像認識手法を開発したことを発表した。
(以下略、続きはソースでご確認ください)
マイナビニュース 2024/02/07 15:23
https://news.mynavi.jp/techplus/article/20240207-2879063/プレプリント
FFT-based Dynamic Token Mixer for Vision
https://arxiv.org/abs/2303.03932 - 2 : 2024/02/08(木) 23:18:00.88 ID:j1iHhlIa
- 分かりやすく言うと絵を見て和音が聴こえるようなものか
- 4 : 2024/02/09(金) 00:52:08.43 ID:dKZRcgv6
- 生成AIだとU-netという方法で逆畳み込みなんて方法も使うが
ここでその逆畳み込みのフィルターもフーリエ変換で出来たら面白いがちょっと難しいか???必死になってNVIDIAの独占するVRAMも大きいが値段も凄いGPU買ってたのが
「こんなの4GBのVRAMでいいじゃん」ってなったらそりゃ嬉しい事か - 5 : 2024/02/09(金) 01:29:01.78 ID:njYrzXV+
- 犯罪捜査にも使えそうだな
時代が榊マリ子に近づいてきた。 - 6 : 2024/02/09(金) 10:15:57.83 ID:1Q1R7kNc
- 人間の脳
ほとんどを映像解析の機能をしている言葉もにおいも触覚も文字や画像や色でデータのやり取りをしている
ブレイン・マシン・インターフェイスの読み取りは映像を読み取っていることになる
- 9 : 2024/02/09(金) 13:10:16.56 ID:cLehuE1h
- 今迄は大きな画像でもそのまま解析していたが事前に入力データをフーリエ変換してしまう手法を開発した。
例えば大きなサイズ画像を動的フィルターとして用いる場合
画像を固定値縮小リサイズ→動的なフィルターを自動生成
固定リサイズ画像解析結果(=グローバルな動的フィルター)は共有ライブラリの様に扱えるので
入力データを固定長にして共有ライブラリによって振るいわけが容易&使用メモリの削減を可能としたという具合なのかな
素人の感想なので全く的を得ていないかも。間違っていたら申し訳ないです。 - 10 : 2024/02/09(金) 13:29:18.30 ID:85jp5w+M
- 自分も似たようなことを思いついていたのにやられた
……というか画像処理を学んでれば誰でも思いつくわな - 11 : 2024/02/09(金) 14:25:00.17 ID:T3FZm3kt
- 光学処理でもって、絵の中の似た部分を検出するというのがずーーっと昔から(半世紀以上前から)
されていたが、光学処理(レンズ)というのは空間光学像のフーリエ変換に他ならない。
畳み込みによる相関検出ができる。 - 12 : 2024/02/09(金) 15:08:46.86 ID:XoLVMTI9
- 人間も似たようにして認識してるのかな
- 14 : 2024/02/10(土) 08:00:04.55 ID:ngG7pcgw
- フーリエ変換は画像にも音声にも適用できるのがすごい
- 15 : 2024/02/10(土) 08:19:05.89 ID:uJs02qxj
- FFT にしただけ?
- 16 : 2024/02/10(土) 08:22:58.21 ID:aV4RUKbw
- けど立教だよね…
- 36 : 2024/03/05(火) 08:15:33.92 ID:gfpWZnRF
- >>16
出た、学歴差別主義者。 - 17 : 2024/02/10(土) 08:41:29.90 ID:144MgPW3
- もしかしたらおおごとかもしれんから俺も確認してみる
まぁあんま期待すんなよ
画像推論のボトルネックはバス転送速度の方にあるから - 18 : 2024/02/10(土) 12:26:45.23 ID:lk6SrkBe
- AI付き監視カメラが低コストになって不審者の発見がはかどる訳か
- 19 : 2024/02/10(土) 16:51:52.26 ID:+ElKP7l+
- 現代でもフーリエ変換なんて古典的手法から新しい技術ができるなんてすごいなあ
- 21 : 2024/02/10(土) 19:09:00.50 ID:E56Zs5Tb
- これさ画像1に対して画像1用の周波数フィルタをかけることがポイントみたいだけど
事前に画像1にどのようなフィルタをかければいいかわかってるのなら
その画像の内容は既にわかってるってことだろw意味あるのかねw
- 26 : 2024/02/11(日) 04:33:22.74 ID:XsKf6SQ3
- >>21
意味ある - 22 : 2024/02/10(土) 20:57:59.33 ID:kZa1alwY
- この画像はなんですか?じゃなくてこの画像から特定の波動を感じますか?だから、あるかないかを判別する医療分野でむちゃくちゃ役に立つと思う。
- 23 : 2024/02/10(土) 21:03:01.71 ID:bsRwTfxL
- 予めラベルを振ってある物体の画像が存在する部分だけ選ぶとかなら
それで十分だな - 24 : 2024/02/10(土) 21:18:16.45 ID:DcNVC6KV
- まったく記事は読んでないが、
今まで画像をピクセルとして解析・学習してフィルタとかにしてたのを、
jpegデータのまま解析・学習しても同じことができちゃいました!って話? - 25 : 2024/02/11(日) 04:26:09.27 ID:XsKf6SQ3
- >>24
違う - 27 : 2024/02/11(日) 04:58:53.19 ID:YLVU8SWl
- >フーリエ変換を用いて
そんなことなら20、30年前からやってるかと・・
- 28 : 2024/02/11(日) 09:06:29.77 ID:XsKf6SQ3
- Transfomerとか使ってるから20年前なんて姿形ないかと…
- 29 : 2024/02/11(日) 09:48:32.39 ID:wlOIHVU2
- 遅くなるだけだろう
- 30 : 2024/02/11(日) 11:39:23.73 ID:of3lESVq
- りんごの画像ならりんごわと認識させてそこだけ処理するんじゃないの?
- 31 : 2024/02/11(日) 12:14:51.24 ID:ptfUBIXp
- りんごAの場合
ナシなどと区別するための
色相中央値フィルターと形状中央値フィルターなどでりんごか否かを判別し
りんごAがりんごであれば中央値フィルターに組み込まれて精度を向上させるのかもしれない - 32 : 2024/02/11(日) 12:42:04.09 ID:ptfUBIXp
- 逆にリンゴAがリンゴであるのにも関わらずリンゴではないと判断された場合
局所最適解フィルターなり特異点フィルターに組み込まれるのかもしれない - 33 : 2024/02/12(月) 21:35:35.06 ID:OyzqcHRi
- 触ってきたけどDockerビルドするのにすげーメモリ必要でDockerfile書き換えいるかった
あとcapabilityも
んで改造しようと思ったら1000クラス分類特化みたいなコーディングでめんどくさくなってやめてきた - 34 : 2024/02/12(月) 22:21:19.38 ID:dimRbJYw
- >改造しようと思ったら1000クラス分類特化みたいなコーディングでめんどくさくなって
転移学習も何も出来んのか
- 35 : 2024/02/13(火) 23:35:57.08 ID:y7eJE/6+
- ガチ勢乙
ハードコーディングに近いのかw
コメント