Ryota Tanaka
@rtanaka_lab
Followers
925
Following
3K
Media
39
Statuses
496
NLP, Vision&Language @ NTT Human Informatics Laboratories
Joined May 2018
Our #CVPR2025 work is out!🚀 𝘾𝙖𝙣 𝙬𝙚 𝙗𝙪𝙞𝙡𝙙 𝙍𝘼𝙂 𝙩𝙝𝙖𝙩 𝙪𝙣𝙙𝙚𝙧𝙨𝙩𝙖𝙣𝙙𝙨 𝙫𝙞𝙨𝙪𝙖𝙡𝙡𝙮-𝙧𝙞𝙘𝙝 𝙙𝙤𝙘𝙪𝙢𝙚𝙣𝙩𝙨 𝙡𝙞𝙠𝙚 𝙘𝙝𝙖𝙧𝙩𝙨/𝙩𝙖𝙗𝙡𝙚𝙨? Yes! VDocRAG understands them through visual features. 📰 https://t.co/5y0rHXg7E5 🌐 https://t.co/ObCVMbBzx7
2
16
43
そして、12/2からのNeurIPSにてNTTがスポンサーになりブースを出します。tsuzumi 2を含め様々なNTT研究所の技術が紹介されますので、現地ご参加の方、ぜひお立ち寄りください! https://t.co/LQS7Pe9Y0o 私も現地参加予定です!どうぞ宜しくお願いします〜
0
4
15
本日、記者会見があり、NTTが研究開発しております「tsuzumi 2」が提供開始になりました🚀 ニュースリリース👉 https://t.co/QNqoLSDyai tsuzumi 2はパラメータ数28.6B・10Tトークン学習の、日本語の理解・生成・指示遂行に強みを持つモデルです。 2025年11月19日から開催される NTT R&D フォーラム
4
153
617
📜Lossless Vocabulary Reduction for LLMs🤖 In this paper, we established a theoretical framework that can flexibly shrink the vocabulary of a given LLM to an arbitrary sub-vocabulary, efficiently in inference-time. 🔗 https://t.co/bhrgGTppls See the video for a quick overview👇
0
10
17
8/17~21ににオランダのロッテルダムで開催される、音声言語処理における世界最大の国際学会 #Interspeech2025 に、NTTから18本の論文が採択されました🎉 #NTTRD #Celebration ▼詳細はこちら https://t.co/F62RAB8d1G
group.ntt
2025年8月17日~21日にオランダのロッテルダムで開催される国際会議Interspeech2025(the 26th edition of the Inte...
0
12
35
7/13~19までバンクーバーで開催される国際会議 #ICML2025 において、NTT研究所より提出された9件の論文が採択されました🏅 ICMLは機械学習分野の基礎理論やアルゴリズムに関する世界最高峰とされる国際会議として、近年の人工知能の発展に大きく寄与しています #NTTRD
https://t.co/GP6cBYkq7j
group.ntt
2025年7月13日から19日まで(太平洋夏時間)カナダ バンクーバーで開催される国際会議ICML(International Conference on Ma...
0
31
112
This is also an awesome work by Ryota Tanaka @rtanaka_lab , enabling visually document processing by RAG with related textual images! Come NOW to #363 at #CVPR2025 poster session!
0
1
7
🎉🎉🎉
6/11~15までアメリカ ナシュビルで開催されるコンピュータビジョン分野の最高峰国際会議 #CVPR2025 において、NTT研究所より提出された5件の論文が採択されました🎉 #NTTRD #Celebration ▼詳細はこちら https://t.co/boI2fjkCcr
0
0
21
🎉 Excited to announce our ICML 2025 paper “Portable Reward Tuning: Towards Reusable Fine‑Tuning across Different Pretrained Models,” co‑first‑authored with @dchiji_en 🤝(equal contribution)! #ICML2025 Preprint 👉 https://t.co/neYxa06i23
1
6
23
Standard RAG struggles with visually-rich documents, losing information by converting everything to text. This paper introduces VDocRAG, processing documents directly as images using Large Vision-Language Models (LVLMs) to preserve visual context for accurate retrieval and
0
4
24
#CVPR2025 に採択された図表が含まれる文書を読み解くVDocRAGに関する研究を公開しました!
Our #CVPR2025 work is out!🚀 𝘾𝙖𝙣 𝙬𝙚 𝙗𝙪𝙞𝙡𝙙 𝙍𝘼𝙂 𝙩𝙝𝙖𝙩 𝙪𝙣𝙙𝙚𝙧𝙨𝙩𝙖𝙣𝙙𝙨 𝙫𝙞𝙨𝙪𝙖𝙡𝙡𝙮-𝙧𝙞𝙘𝙝 𝙙𝙤𝙘𝙪𝙢𝙚𝙣𝙩𝙨 𝙡𝙞𝙠𝙚 𝙘𝙝𝙖𝙧𝙩𝙨/𝙩𝙖𝙗𝙡𝙚𝙨? Yes! VDocRAG understands them through visual features. 📰 https://t.co/5y0rHXg7E5 🌐 https://t.co/ObCVMbBzx7
0
16
102
VDocRAG: Retrieval-Augmented Generation over Visually-Rich Documents @rtanaka_lab et al. introduce a RAG framework that directly understands diverse document formats through visual features. 📝 https://t.co/k29XOi9Bee 👨🏽💻 https://t.co/jsZFphLVQy
0
5
6
💪Key enhancements of VDocRAG (2/2) 🔥𝐍𝐞𝐰 𝐃𝐚𝐭𝐚𝐬𝐞𝐭: OpenDocVQA is the first unified collection of open-domain DocumentVQA datasets encompassing a wide range of document types and formats.
0
0
0
💪Key enhancements of VDocRAG (1/2) 🔥𝐍𝐞𝐰 𝐏𝐫𝐞𝐭𝐫𝐚𝐢𝐧𝐢𝐧𝐠 𝐓𝐚𝐬𝐤𝐬: RCR and RCG compress the entire image representation into a dense token representation, by aligning the text in documents via retrieval and generation tasks.
1
0
3
本日、NTT人間情報研究所 准特別研究員を拝命しました。NTTのマルチモーダル研究を更に加速していきます! また、3/25に東北大学にて、博士号(情報科学)と総長賞を頂きました。関係者の皆さん、ありがとうございました。引き続きよろしくお願いします!
0
12
160
受賞しました!🎉 ありがとうございます!
2
9
80
#AI王 の論文(共著)が、今年度の言語処理学会最優秀論文賞を受賞しました! 🙌 論文を選考くださった方々、「AI王」に関わってくださったすべての皆さまに、心より感謝いたします。 @tohoku_nlp @AioJaqket
2024年度の言語処理学会最優秀論文賞🎉 クイズコンペティションの結果分析から見た日本語質問応答の到達点と課題 ○有山 知希,鈴木 潤,鈴木 正敏,田中 涼太,赤間 怜奈,西田 京介 Vol.31 No.1, pp.47-78 https://t.co/9repdZJUeT おめでとうございます!
0
13
61
#NLP2025 では、主著1本、共著2本の発表があります。 主著は、LLMのファインチューニング段階におけるPadding戦略とPacking戦略の下流タスクに対する影響を調査した話です。 現地参加の方は、 ・03/11 14:50-16:20 1F Q4(ポスター)会場 にぜひお越しください! お待ちしてます! @tohoku_nlp
0
9
31