Shuhei Shimmyo | マルチモーダルRAG開発
@ShimmyoLab
Followers
223
Following
244
Media
51
Statuses
466
GeMM(Generative Media Manager)開発・事業化推進中 / 新明技研 代表, Ph.D. 特徴:生成的検索UI・マルチモーダル・ローカルRAG SDK 技術:VLM・LLM・セマンティック検索 慶應特任助教 → ロボティクス起業 → 米国CV/VLM → 生成AIへ
Joined November 2024
【GeMM(ジェム)とは】 GeMM(Generative Media Manager)は、画像・動画・文書などの非構造メディアをAIで理解し、検索可能にするオンプレ装置です。 図のとおり── ① フォルダ・映像・PDFなどを読み込み ② 生成AIが内容を解析して意味づけ → ベクトル化 ③ ベクトルDBに保存し ④
0
2
10
📄 参考記事: ・CNBC https://t.co/BvkPTFDRF9 ・TechCrunch https://t.co/kr135oFA8L ・WCCFtech https://t.co/tC0rSSE5sM ・Groq公式
0
0
0
NVIDIAが約200億ドルでGroqの技術と人材を獲得——しかしこれは「買収」ではありません。 GroqはGoogleでTPUを発明したJonathan Rossが創業したAIチップスタートアップ。独自のLPU(Language Processing
1
0
0
バックプロパゲーションを発明した本人が、それを超える学習法を提案しています。 Geoffrey Hintonが2022年に発表した「Forward-Forward
3
186
1K
こちらの論文は、手羽先さん@Tebasaki_lab のAP法のベースになっているであろう(私の勝手な推察ですが)金子勇さんのED法を包括的に評価した、という内容です。 話題になっていたので紹介させていただきました。
この論文は手羽先さん @Tebasaki_lab が今やっている手羽先メソッド…もとい、AP法(Akiho Propagation Method)と似たような方向性なのか、それとも全然違うものなのか私にはまだ判断が付きませんが、いずれにせよ面白そうな研究のように思われるので、Geminiさんの力を借りて読んでみようと思います。
1
4
21
「バックプロパゲーションは本当に最善の学習アルゴリズムなのか?」 ディープラーニングの根幹を成すバックプロパゲーションに対し、生物学的な着想から生まれた代替手法「Error Diffusion Learning Algorithm(EDLA)」の包括的評価が報告されました。 ■ バックプロパゲーションの限界
2
80
553
【古い論文だが今でも示唆的】2016年NeurIPS発表の「Direct Feedback Alignment」研究を紹介します。
1
0
1
手羽先さん @Tebasaki_lab の記事に触発されて考察を書きました。 手羽先さんがおそらくベースにしているであろう、ED法の更新則がMRAC(適応制御)とほぼ同じ構造では?という仮説です。 もし正しければ、収束性は制御理論で60年前に証明済みかもしれません。
note.com
はじめに 2024年、映画「Winny」の公開をきっかけに、金子勇氏が考案した「ED法(誤差拡散法)」が再び注目を集めました。 ED法は、現在のAI学習の主流である「誤差逆伝播法(バックプロパゲーション)」を使わずに、ニューラルネットワークを学習させる手法です。2024年に有志がED法を再実装し、MNISTという手書き数字認識タスクで98%以上の精度を達成しています。 2025年4月には、K...
0
2
2
素晴らしい結果ですね!個人的にはAP法?はED法に近しいことをやられているのではと推察していますが、これでLLMが実装できたら世界は変わりますね。 博士過程のときに少し適応制御をかじっていたのですが、ED法の更新則 Δw = η × e × x は、適応制御のMRAC(Model Reference Adaptive
ついに秒間5億枚(500,000,000fps)でMNISTを推論できるAIモデルが出来たぞ!!! FPGAに直接実装可能で、既存モデルの1/2のパラメーター数&バイナリ化しても精度96.89%!! 誤差逆伝播法なしで全ての重みを並列で更新でき、専用人工知能チップ回路を作ればGPUよりも爆速で学習できる可能性あり!!
0
0
1
「この音が聞こえる動画を探して」という検索が、いよいよ現実味を帯びてきました。 これまでマルチモーダルAIといえば、画像とテキストの組み合わせが主流でした。CLIPやSigLIPの成功により、テキストで画像を検索したり、画像の内容を説明したりすることは当たり前になっています。
2
0
1
LLMエージェントの学習において、最大のボトルネックは「質の高いインタラクションデータの不足」です。GenEnvはこの課題に教育学の概念を借りた巧みなアプローチで挑んでいます。 ■ 「最近接発達領域」をAIに応用
2
0
1