onely7_deep Profile Banner
Daiki Shiono Profile
Daiki Shiono

@onely7_deep

Followers
473
Following
4K
Media
7
Statuses
192

D2 @tohoku_nlp Interests: V&L/NLP Looking for a job 💼

東京 ↔ 仙台
Joined October 2018
Don't wanna be here? Send us removal request.
@hiroto_kurita
Hiroto Kurita
12 days
Want to compress your static embeddings 𝙬𝙞𝙩𝙝𝙤𝙪𝙩 𝙩𝙧𝙖𝙞𝙣𝙞𝙣𝙜? Do PCA but 𝙬𝙚𝙞𝙜𝙝𝙩 𝙗𝙮 𝙬𝙤𝙧𝙙 𝙛𝙧𝙚𝙦𝙪𝙚𝙣𝙘𝙮 𝙥(𝙬): Zipfian Whitening shrinks embeddings of 300d → 50d (~16%) with no STS score drop. https://t.co/SnNvMS1Oxr
2
8
39
@catshun_
s-miyawaki | Algomatic Works
15 days
お越しいただいた皆様ありがとうございました🙌 本日の登壇資料です! #Lancers_TechBook https://t.co/TVs7ajHaWz
@catshun_
s-miyawaki | Algomatic Works
15 days
本日はこちらで登壇いたします 🙌 #Lancers_TechBook https://t.co/mBL5uZwPLA
4
52
449
@ymg_aq
Yu Yamaguchi | チューリング CTO
17 days
チューリング、東京都内で30分の無介入自動運転を達成しました。 この動画の中だけでも、右左折はもちろん路駐避け、歩行者、対向車、道路工事への対応など、E2Eモデルならではの運転を見せています。 一つ一つの課題をクリアして、ようやくE2E自動運転のポテンシャルを引き出すところまできました
1
14
100
@okoge_kaz
Kazuki Fujii
30 days
NVIDIA NeMoを利用したgpt-ossの学習方法について記事を執筆しました NGCコンテナ内のTransformerEngine、cuDNN versionのupdateだけでなく、NeMo側の実装、Megatron-Coreの実装も修正する必要がありました LLMの研究開発において実は大変なライブラリ整備に関する記事です https://t.co/i31nfNehwf
Tweet card summary image
zenn.dev
0
54
278
@ymg_aq
Yu Yamaguchi | チューリング CTO
1 month
チューリング、シリーズA 1st closeで153億円の資金調達を実施しました!🎉 今年の国内シリーズA調達の中では最大ではないかと思います。 今回の調達により、研究開発と事業展開の両輪をさらに強化し、日本発の完全自動運転の実現に向けて加速していきます https://t.co/zHR9b7JanS
3
95
601
@okoge_kaz
Kazuki Fujii
1 month
10月はじめに行っていたデバッグ作業の一部をブログ化しました!LLM開発の裏で行われている作業の雰囲気を感じていただけますと幸いです。 LLM開発の裏で行われるデバッグ作業: PyTorch DCP|Kazuki Fujii https://t.co/S30aNeBdbg #zenn
Tweet card summary image
zenn.dev
1
40
220
@okoge_kaz
Kazuki Fujii
1 month
We’re releasing SwallowCode-v2 & SwallowMath-v2 — two high-quality, Apache-2.0 licensed datasets for mid-stage pretraining. https://t.co/mPSfrbuwvc https://t.co/LFWRGNzKUo Details in the thread 🧵
5
38
153
@ymg_aq
Yu Yamaguchi | チューリング CTO
1 month
チューリング、AAAI2026に論文が採択され、上位5%程度となる口頭発表に選出されました!🎉🎉🎉 運転シーンにおけるVLAの時空間理解データセット「STRIDE-QA」とその発展的な学習モデルの研究です。このデータセットの一部はHuggingFaceで公開しています https://t.co/7bW5wFZyQB
2
48
281
@mervenoyann
merve
2 months
open-source OCR models are super cheap to run and privacy first 🤝 BUT there's a ton of new models out there: DeepSeek-OCR, Nanonets, PaddleOCR, how do you pick them? 🤯 don't worry though, @huggingface got you covered! 🫡🧶
13
121
1K
@ymg_aq
Yu Yamaguchi | チューリング CTO
2 months
チューリング、ハワイで開催されているICCVに参加しています⛱️🏄️初日は2つのワークショップで発表があります! End-to-End 3D Learning Workshop (Poster) 10/19 14:35–15:40 https://t.co/8JexiQjmCW 2COOOL Workshop (Poster & Winner call) 10/19 14:30-15:50 https://t.co/k2zjITnfuA
0
6
37
@anonamename
Anonamename
2 months
学習無しでQwen3-VLやGLM-4.5VなどバカデカVLMで推論する脳筋ソリューションです! 最終評価は人手評価であったため評価用A/Bテストアプリを@ymg_aq さんが作ってくれて2位になれました! コード公開してます! https://t.co/dwyTL7pzCd
Tweet card summary image
github.com
Contribute to riron1206/kaggle-2COOOL-2nd-Place-Solution development by creating an account on GitHub.
@ymg_aq
Yu Yamaguchi | チューリング CTO
2 months
なお、リーダーボードはKaggleではなくWorkshopのものが最終評価版になります。 https://t.co/7aOccbK9eY チーム解法は@anonamenameがHierarchical ReasoningをVLMに適用したスマートな手法を一人で考案・実装してくれました。(チームとは…?) 詳細はICCV Workshopにてポスターで発表予定です
0
6
42
@hiroto_kurita
Hiroto Kurita
2 months
test-time trainingを用いてRNNの隠れ状態にコンテキストを賢く圧縮する機構を提案した論文を紹介しました.我々の良く知る圧縮手法は自己教師あり学習そのものなので,各トークンを「データ」と見立てて推論時にも自己教師あり学習をしてしまおうというアイデアです. https://t.co/GdWZqaKJYo
Tweet card summary image
speakerdeck.com
1
1
22
@Alibaba_Qwen
Qwen
3 months
🚀 We're thrilled to unveil Qwen3-VL — the most powerful vision-language model in the Qwen series yet! 🔥 The flagship model Qwen3-VL-235B-A22B is now open-sourced and available in both Instruct and Thinking versions: ✅ Instruct outperforms Gemini 2.5 Pro on key vision
81
298
2K
@go2oo2
Go Kamoda
3 months
3月のNLPで発表した(共著)ものです 私個人も(は) 文字単位モデルの色々気になるなぁ でもUnicodeポイントをそのまま使うのは色々問題が起きるなぁ byteなら埋め込み行列が256で済むなぁ そういえばデジタルデータって、バイト列で表せるなぁ などの妄想をしながら議論/設計/構築してました
@k8kudo
Keito Kudo
3 months
byte tokenizerを採用したBERT (4モデル) と,同じくbyte tokenizerを採用した実験的なMulti-LM-head日本語言語モデルを公開しました. byte tokenizerを使った 変な言語モデルに興味がある方がいらっしゃればぜひ触ってみてください! https://t.co/BEFuo4dtMn https://t.co/Gxwf6RaGYm
0
1
11
@k8kudo
Keito Kudo
3 months
byte tokenizerを採用したBERT (4モデル) と,同じくbyte tokenizerを採用した実験的なMulti-LM-head日本語言語モデルを公開しました. byte tokenizerを使った 変な言語モデルに興味がある方がいらっしゃればぜひ触ってみてください! https://t.co/BEFuo4dtMn https://t.co/Gxwf6RaGYm
0
7
31
@onely7_deep
Daiki Shiono
3 months
遅ればせながら iOS 版 azooKey の Zenzai を有効にして使っていますが、かなり快適だ... iPhone16 の高性能チップの恩恵を久々に実感している ⌨️
@miwa_ensan
Miwa - azooKeyの開発者
3 months
iOS版のazooKeyにZenzai載せました!!かなり良くなってるので使ってみてください〜!
0
3
10
@lusxvr
Luis
4 months
Today, we are releasing FineVision, a huge open-source dataset for training state-of-the-art Vision-Language Models: > 17.3M images > 24.3M samples > 88.9M turns > 9.5B answer tokens Here are my favourite findings:
19
209
1K
@kento_sasaki1
Kento Sasaki | Turing Inc.
4 months
STRIDE-QAのベンチマークをHuggingFace、GitHubに公開しました!🚀 https://t.co/EuRW85oZPJ https://t.co/mDaAnkoLzf
huggingface.co
@kento_sasaki1
Kento Sasaki | Turing Inc.
4 months
運転シーンにおけるVLMの時空間理解データセット「STRIDE-QA」の論文をarXivに公開しました! 本研究はICCV 2025 End-to-End 3D Learning Workshop にショートペーパーが採択され、現地発表予定です🌴 📄 論文: https://t.co/wcgQjLGdlI 🌐 Workshop: https://t.co/tE1n7Vyf0b
0
8
17
@onely7_deep
Daiki Shiono
4 months
こちら私も少し関わらせていただきました!🚗 自動運転ドメインにおける(空間理解だけでなく) 時空間理解が求められる問題も含む既存のものよりも比較的大きな VQA データセットを構築した話になってます! 面白いプロジェクトでしたのでぜひ覗いてみてください〜!
@kento_sasaki1
Kento Sasaki | Turing Inc.
4 months
運転シーンにおけるVLMの時空間理解データセット「STRIDE-QA」の論文をarXivに公開しました! 本研究はICCV 2025 End-to-End 3D Learning Workshop にショートペーパーが採択され、現地発表予定です🌴 📄 論文: https://t.co/wcgQjLGdlI 🌐 Workshop: https://t.co/tE1n7Vyf0b
0
8
40
@kento_sasaki1
Kento Sasaki | Turing Inc.
4 months
テックブログ「自動運転基盤モデルの最前線:VLAモデルの今とこれから」を公開しました🚀 この記事では、自動運転VLAの最新動向について紹介しています! https://t.co/pZ9EuSd3H0 8/21(木) 19:00~のオンラインテックトークでは、このテックブログの内容について深堀りします。詳細はスレッドから▶
Tweet card summary image
zenn.dev
1
24
100