Naoaki Okazaki Profile
Naoaki Okazaki

@chokkanorg

Followers
8K
Following
2K
Media
69
Statuses
3K

東京工業大学 情報理工学院 情報工学系 知能情報コース.自然言語処理・人工知能・機械学習の研究者.趣味プログラマ.

Tokyo, Japan
Joined November 2009
Don't wanna be here? Send us removal request.
@okoge_kaz
Kazuki Fujii
6 days
NVIDIA NeMoを利用したgpt-ossの学習方法について記事を執筆しました NGCコンテナ内のTransformerEngine、cuDNN versionのupdateだけでなく、NeMo側の実装、Megatron-Coreの実装も修正する必要がありました LLMの研究開発において実は大変なライブラリ整備に関する記事です https://t.co/i31nfNehwf
Tweet card summary image
zenn.dev
0
53
273
@chokkanorg
Naoaki Okazaki
4 days
Swallow LLM Leaderboard v2にPLaMo 3 NICTシリーズ(事前学習済みモデル)を追加しました。前バージョンのPLaMo 2と比較すると、特にコーディング (JHumanEval) で大幅な性能向上が見られ、3Tトークンで学習された31Bモデルは純国産モデルとして良好な性能と言えます。 https://t.co/TWgbJVrOh0
Tweet card summary image
swallow-llm.github.io
日本語・英語の大規模言語モデルの性能を棒グラフやレーダーチャート、散布図で比較
0
8
20
@RyoKamoi_ja
鴨井 遼
7 days
昨日は東京科学大学岡崎研究室 @chokkanorg に伺い、トークをさせていただきました。お誘いいただきありがとうございました! https://t.co/xsVKY1vmdQ
0
3
38
@preferred_jp
PFN Tech
11 days
【ブログ】PFNが開発している大規模言語モデル PLaMo™の次世代バージョンの開発を現在行っています。 この開発の中で行った8Bと31Bの小規模モデルによる事前学習の検証についてブログにまとめました。 モデルはHugging Faceで公開していますので是非遊んでみてください。
Tweet card summary image
tech.preferred.jp
背景 Preferred Networksでは国立研究開発法人情報通信研究機構(以下:
0
65
226
@KatsumaNarisawa
成澤 克麻 | N-Works
11 days
Findy Freelanceのユーザー様向けミートアップで登壇させてもらいました! タイトルがイカついですが、Q&Aや交流会も盛り上がって何よりでした。 口頭での補足がメインコンテンツでしたが、資料アップしたのでよければご覧ください! https://t.co/QI0wfEZaWe
Tweet card summary image
speakerdeck.com
2025年11月13日(木) Findy Freelance Meetup in Autumn
1
2
11
@okoge_kaz
Kazuki Fujii
12 days
10月はじめに行っていたデバッグ作業の一部をブログ化しました!LLM開発の裏で行われている作業の雰囲気を感じていただけますと幸いです。 LLM開発の裏で行われるデバッグ作業: PyTorch DCP|Kazuki Fujii https://t.co/S30aNeBdbg #zenn
Tweet card summary image
zenn.dev
1
40
221
@chokkanorg
Naoaki Okazaki
18 days
SwallowCode, SwallowMathのv2を公開しました。このデータセットを中間学習に使用すると、他のデータセットで学習したのと同等かそれ以上の性能(コーディングや数学において)が出ています。ライセンスもApache 2.0になり、使いやすくなりました。詳細は藤井 (@okoge_kaz) さんのスレッドで。
@okoge_kaz
Kazuki Fujii
18 days
We’re releasing SwallowCode-v2 & SwallowMath-v2 — two high-quality, Apache-2.0 licensed datasets for mid-stage pretraining. https://t.co/mPSfrbuwvc https://t.co/LFWRGNzKUo Details in the thread 🧵
0
19
110
@okoge_kaz
Kazuki Fujii
18 days
We’re releasing SwallowCode-v2 & SwallowMath-v2 — two high-quality, Apache-2.0 licensed datasets for mid-stage pretraining. https://t.co/mPSfrbuwvc https://t.co/LFWRGNzKUo Details in the thread 🧵
5
38
153
@chokkanorg
Naoaki Okazaki
22 days
岡崎研究室は #工大祭2025 で二日間研究室公開を行いました。本日は工大祭実行委員会や大学の関係者の皆様の強い思いで開催できることになり、ドタバタでしたが、たくさんの方にご来場頂き、ありがとうございました。うちの研究室の学生だけでなく、荒瀬研の学生さんにも展示を手伝って頂きました。
0
3
39
@sciencetokyo_ja
Science Tokyo (東京科学大学)
22 days
本学の安全確認完了と工大祭の再開 https://t.co/rfuZBlwld7 #ScienceTokyo
Tweet card summary image
isct.ac.jp
2
1K
2K
@sciencetokyo_ja
Science Tokyo (東京科学大学)
23 days
爆破予告による工大祭の中止(11月3日)と大岡山キャンパスの立ち入り制限 https://t.co/BSvDPXidSW #ScienceTokyo
Tweet card summary image
isct.ac.jp
90
3K
7K
@chokkanorg
Naoaki Okazaki
25 days
Swallow Leaderboardの評価タスクにJamC-QA (SB Intuitionsさん開発) を追加しました。またApertus-8B-Instruct, Apertus-70B-Instruct, ELYZA-Shortcut-1.0-Qwen-32B, Flux-Japanese-Qwen2.5-32B-Instruct-V1.0, Qwen2.5-0.5B, QwQ Bakeneko 32Bの評価結果を追加しました。
0
3
7
@chokkanorg
Naoaki Okazaki
25 days
普段あまりスポットライトが当たらないLLMの評価について、W&Bの年次イベントFully Connected Tokyoでご紹介いたしました。 『進化する大規模言語モデル評価: Swallowプロジェクトにおける実践と知見』スライド https://t.co/6uOPbIB2N2 Swallow-evaluation-instruct
Tweet card summary image
github.com
Swallowプロジェクト 事後学習済み大規模言語モデル 評価フレームワーク. Contribute to swallow-llm/swallow-evaluation-instruct development by creating an account on GitHub.
@olachinkei
Keisuke Kamata
2 months
W&Bの無料の年次イベントFully Connected Tokyoの開催まで1ヶ月を切りました!登壇紹介シリーズ! 東京科学大学の岡崎先生 (@chokkanorg) より、日本語モデルの大黒柱的な存在であるSwallowプロジェクトにおける実践と知見をお話いただきます! #wandb https://t.co/aJBUWDwd0I
1
22
104
@koshiro_sa110
Koshiro Saito
1 month
I’m happy to share that our paper was selected for a spotlight at the 1st workshop on Multilingual and Equitable Language Technologies (MELT), part of COLM 2025! - MELT Accepted Submissions: https://t.co/0ronuFsnmj - COLM 2025: https://t.co/fKQaBGmJjs Thanks to everyone!
0
6
32
@kento_lyrics
Kento Watanabe
2 months
JST ACT-X 研究領域「次世代 AI を築く数理・情報科学の革新」に「音楽情報と実世界身体動作を橋渡しする統合AIの開発」という研究課題が採択されました。頑張ります🎶💃
@JST_Kisokenkyu
JST CREST・さきがけ・ACT-X
2 months
2025年度の採択結果を公開しました。 各領域の ✓今年度の採択課題 ✓選考についての総括総評 などを公開しています。 ◎プレスリリースはこちらです。 https://t.co/ifI8BCt4nS ◎CREST https://t.co/8m47BwDKUY ◎さきがけ https://t.co/0ro6X1GH6z ◎ACT-X https://t.co/XjsCVDxslN
2
5
83
@Youmima1015
Youmi Ma
2 months
JST ACT-X研究領域「次世代 AI を築く数理・情報科学の革新」に研究提案が採択されました。頑張ります!
@JST_Kisokenkyu
JST CREST・さきがけ・ACT-X
2 months
2025年度の採択結果を公開しました。 各領域の ✓今年度の採択課題 ✓選考についての総括総評 などを公開しています。 ◎プレスリリースはこちらです。 https://t.co/ifI8BCt4nS ◎CREST https://t.co/8m47BwDKUY ◎さきがけ https://t.co/0ro6X1GH6z ◎ACT-X https://t.co/XjsCVDxslN
3
3
122
@rtokuhisa
Ryoko TOKUHISA / 徳久良子
3 months
FIT2025でFIT奨励賞を受賞しました(主著は @kipeo22 ) 日本の文化習慣のデータセット構築とLLM評価に関する発表です 共著者の方々はもちろん 有益な評価ツール(llm-jp-eval-mm)を作ってくれた @silviasetitech @strayer_13 MACEにアドバイスくれた @shiki_satou @shojimoriya_nlp に感謝です
1
8
45
@madyagi
シバタアキラ
3 months
過去最大のFully Connected Tokyo, 発表されました!毎年やってますがこれほどコアで充実したAI開発者向けのイベントは他にないです💪 申し込み: https://t.co/AT4inJzYvl 📣拡散にご協力ください! 今年のスピーカー (まだ増えます!) - 秋葉 拓哉 氏 / Sakana AI @iwiwi - Xu Zheying 氏 /
Tweet card summary image
fullyconnected.jp
トップAI開発者・研究者が集まるW&Bのユーザーカンファレンス!実践的なハンズオンワークショップから、著名な登壇者が共有する知見やベストプラクティス盛りたくさんの講演まで
1
21
62
@okoge_kaz
Kazuki Fujii
3 months
AWS AI Frontier Meetupにて Swallow Projectでの開発に関して発表を行いました!! https://t.co/dsGaZjIMEC
Tweet card summary image
speakerdeck.com
0
15
78
@MasahiroKaneko_
Masahiro Kaneko
3 months
Two first-author long papers accepted to #EMNLP2025 main, and one co-authored long paper in Findings 🎉 Thanks @rem_h4_, @AlhamFikri, @chokkanorg, and @eltimster! All on arXiv📜 - https://t.co/Uvu34nkxEi - https://t.co/GTnDMz7Hof - https://t.co/bGfw7GHWl5
1
10
88