Daiki Shiono @onely7_deep X Profile

Daiki Shiono

@onely7_deep

Followers

473

Following

4K

Media

7

Statuses

192

D2 @tohoku_nlp Interests: V&L/NLP Looking for a job 💼

https://t.co/NzeZdPL49k

東京 ↔ 仙台

Joined October 2018

Don't wanna be here? Send us removal request.

Hiroto Kurita

@hiroto_kurita

12 days

Want to compress your static embeddings 𝙬𝙞𝙩𝙝𝙤𝙪𝙩 𝙩𝙧𝙖𝙞𝙣𝙞𝙣𝙜? Do PCA but 𝙬𝙚𝙞𝙜𝙝𝙩 𝙗𝙮 𝙬𝙤𝙧𝙙 𝙛𝙧𝙚𝙦𝙪𝙚𝙣𝙘𝙮 𝙥(𝙬): Zipfian Whitening shrinks embeddings of 300d → 50d (~16%) with no STS score drop. https://t.co/SnNvMS1Oxr

2

8

39

s-miyawaki | Algomatic Works

@catshun_

15 days

お越しいただいた皆様ありがとうございました🙌 本日の登壇資料です！ #Lancers_TechBook https://t.co/TVs7ajHaWz

s-miyawaki | Algomatic Works

@catshun_

15 days

本日はこちらで登壇いたします 🙌 #Lancers_TechBook https://t.co/mBL5uZwPLA

4

52

449

Yu Yamaguchi | チューリング CTO

@ymg_aq

17 days

チューリング、東京都内で30分の無介入自動運転を達成しました。この動画の中だけでも、右左折はもちろん路駐避け、歩行者、対向車、道路工事への対応など、E2Eモデルならではの運転を見せています。一つ一つの課題をクリアして、ようやくE2E自動運転のポテンシャルを引き出すところまできました

1

14

100

Kazuki Fujii

@okoge_kaz

30 days

NVIDIA NeMoを利用したgpt-ossの学習方法について記事を執筆しました NGCコンテナ内のTransformerEngine、cuDNN versionのupdateだけでなく、NeMo側の実装、Megatron-Coreの実装も修正する必要がありました LLMの研究開発において実は大変なライブラリ整備に関する記事です https://t.co/i31nfNehwf

zenn.dev

0

54

278

Yu Yamaguchi | チューリング CTO

@ymg_aq

1 month

チューリング、シリーズA 1st closeで153億円の資金調達を実施しました！🎉 今年の国内シリーズA調達の中では最大ではないかと思います。今回の調達により、研究開発と事業展開の両輪をさらに強化し、日本発の完全自動運転の実現に向けて加速していきます https://t.co/zHR9b7JanS

3

95

601

Kazuki Fujii

@okoge_kaz

1 month

10月はじめに行っていたデバッグ作業の一部をブログ化しました！LLM開発の裏で行われている作業の雰囲気を感じていただけますと幸いです。 LLM開発の裏で行われるデバッグ作業: PyTorch DCP｜Kazuki Fujii https://t.co/S30aNeBdbg #zenn

zenn.dev

1

40

220

Kazuki Fujii

@okoge_kaz

1 month

We’re releasing SwallowCode-v2 & SwallowMath-v2 — two high-quality, Apache-2.0 licensed datasets for mid-stage pretraining. https://t.co/mPSfrbuwvc https://t.co/LFWRGNzKUo Details in the thread 🧵

5

38

153

Yu Yamaguchi | チューリング CTO

@ymg_aq

1 month

チューリング、AAAI2026に論文が採択され、上位5%程度となる口頭発表に選出されました！🎉🎉🎉 運転シーンにおけるVLAの時空間理解データセット「STRIDE-QA」とその発展的な学習モデルの研究です。このデータセットの一部はHuggingFaceで公開しています https://t.co/7bW5wFZyQB

2

48

281

merve

@mervenoyann

2 months

open-source OCR models are super cheap to run and privacy first 🤝 BUT there's a ton of new models out there: DeepSeek-OCR, Nanonets, PaddleOCR, how do you pick them? 🤯 don't worry though, @huggingface got you covered! 🫡🧶

13

121

1K

Yu Yamaguchi | チューリング CTO

@ymg_aq

2 months

チューリング、ハワイで開催されているICCVに参加しています⛱️🏄️初日は2つのワークショップで発表があります！ End-to-End 3D Learning Workshop (Poster) 10/19 14:35–15:40 https://t.co/8JexiQjmCW 2COOOL Workshop (Poster & Winner call) 10/19 14:30-15:50 https://t.co/k2zjITnfuA

0

6

37

Anonamename

@anonamename

2 months

学習無しでQwen3-VLやGLM-4.5VなどバカデカVLMで推論する脳筋ソリューションです！最終評価は人手評価であったため評価用A/Bテストアプリを@ymg_aq さんが作ってくれて2位になれました！コード公開してます！ https://t.co/dwyTL7pzCd

github.com

Contribute to riron1206/kaggle-2COOOL-2nd-Place-Solution development by creating an account on GitHub.

Yu Yamaguchi | チューリング CTO

@ymg_aq

2 months

なお、リーダーボードはKaggleではなくWorkshopのものが最終評価版になります。 https://t.co/7aOccbK9eY チーム解法は@anonamenameがHierarchical ReasoningをVLMに適用したスマートな手法を一人で考案・実装してくれました。（チームとは…？）詳細はICCV Workshopにてポスターで発表予定です

0

6

42

Hiroto Kurita

@hiroto_kurita

2 months

test-time trainingを用いてRNNの隠れ状態にコンテキストを賢く圧縮する機構を提案した論文を紹介しました．我々の良く知る圧縮手法は自己教師あり学習そのものなので，各トークンを「データ」と見立てて推論時にも自己教師あり学習をしてしまおうというアイデアです． https://t.co/GdWZqaKJYo

speakerdeck.com

1

22

Qwen

@Alibaba_Qwen

3 months

🚀 We're thrilled to unveil Qwen3-VL — the most powerful vision-language model in the Qwen series yet! 🔥 The flagship model Qwen3-VL-235B-A22B is now open-sourced and available in both Instruct and Thinking versions: ✅ Instruct outperforms Gemini 2.5 Pro on key vision

81

298

2K

Go Kamoda

@go2oo2

3 months

3月のNLPで発表した（共著）ものです私個人も（は）文字単位モデルの色々気になるなぁでもUnicodeポイントをそのまま使うのは色々問題が起きるなぁ byteなら埋め込み行列が256で済むなぁそういえばデジタルデータって、バイト列で表せるなぁなどの妄想をしながら議論/設計/構築してました

Keito Kudo

@k8kudo

3 months

byte tokenizerを採用したBERT (4モデル) と，同じくbyte tokenizerを採用した実験的なMulti-LM-head日本語言語モデルを公開しました． byte tokenizerを使った変な言語モデルに興味がある方がいらっしゃればぜひ触ってみてください! https://t.co/BEFuo4dtMn https://t.co/Gxwf6RaGYm

0

1

11

Keito Kudo

@k8kudo

3 months

byte tokenizerを採用したBERT (4モデル) と，同じくbyte tokenizerを採用した実験的なMulti-LM-head日本語言語モデルを公開しました． byte tokenizerを使った変な言語モデルに興味がある方がいらっしゃればぜひ触ってみてください! https://t.co/BEFuo4dtMn https://t.co/Gxwf6RaGYm

0

7

31

Daiki Shiono

@onely7_deep

3 months

遅ればせながら iOS 版 azooKey の Zenzai を有効にして使っていますが、かなり快適だ... iPhone16 の高性能チップの恩恵を久々に実感している ⌨️

Miwa - azooKeyの開発者

@miwa_ensan

3 months

iOS版のazooKeyにZenzai載せました！！かなり良くなってるので使ってみてください〜！

0

3

10

Luis

@lusxvr

4 months

Today, we are releasing FineVision, a huge open-source dataset for training state-of-the-art Vision-Language Models: > 17.3M images > 24.3M samples > 88.9M turns > 9.5B answer tokens Here are my favourite findings:

19

209

1K

Kento Sasaki | Turing Inc.

@kento_sasaki1

4 months

STRIDE-QAのベンチマークをHuggingFace、GitHubに公開しました！🚀 https://t.co/EuRW85oZPJ https://t.co/mDaAnkoLzf

huggingface.co

Kento Sasaki | Turing Inc.

@kento_sasaki1

4 months

運転シーンにおけるVLMの時空間理解データセット「STRIDE-QA」の論文をarXivに公開しました！本研究はICCV 2025 End-to-End 3D Learning Workshop にショートペーパーが採択され、現地発表予定です🌴 📄 論文: https://t.co/wcgQjLGdlI 🌐 Workshop: https://t.co/tE1n7Vyf0b

0

8

17

Daiki Shiono

@onely7_deep

4 months

こちら私も少し関わらせていただきました！🚗 自動運転ドメインにおける(空間理解だけでなく) 時空間理解が求められる問題も含む既存のものよりも比較的大きな VQA データセットを構築した話になってます！面白いプロジェクトでしたのでぜひ覗いてみてください〜！

Kento Sasaki | Turing Inc.

@kento_sasaki1

4 months

運転シーンにおけるVLMの時空間理解データセット「STRIDE-QA」の論文をarXivに公開しました！本研究はICCV 2025 End-to-End 3D Learning Workshop にショートペーパーが採択され、現地発表予定です🌴 📄 論文: https://t.co/wcgQjLGdlI 🌐 Workshop: https://t.co/tE1n7Vyf0b

0

8

40

Kento Sasaki | Turing Inc.

@kento_sasaki1

4 months

テックブログ「自動運転基盤モデルの最前線：VLAモデルの今とこれから」を公開しました🚀 この記事では、自動運転VLAの最新動向について紹介しています！ https://t.co/pZ9EuSd3H0 8/21(木) 19:00~のオンラインテックトークでは、このテックブログの内容について深堀りします。詳細はスレッドから▶

zenn.dev

1

24

100