
hpp
@hpp_ricecake
Followers
6K
Following
184K
Media
1K
Statuses
20K
Kotoba Technologies Japan && 名大D3 | 絵と服とゲーム | @hayato_tkgs
Nagoya Univ. D3
Joined October 2018
日本語ModernBERTブログの中で一番好きなパート.トークナイザを後から差し替えても(MeCabで分割してからSentencePieceなど)、性能が対して下がらないことを示しております. NERとかトークンラベリング系タスクでハッピーになれる.
sbintuitions.co.jp
概要 こんにちは、SB Intuitions株式会社インターンの塚越です。 先日、日本語・英語合わせて約4.4T tokensを学習した日本語ModernBERTというモデルを構築・公開しました。 公開したモデルがどんなモデル、どんな性能なのかについては日本語ModernBERTの開発: 開発と評価編 (1/3)を、開…
1
7
91
RT @PreferredNetJP: 【発表】日本語に強いPLaMo翻訳のブラウザ拡張機能を、ChromeとFirefox向けに提供開始しました。期間限定の無料トライアルとしてページ数無制限で手軽に利用可能です。是非お試しください!..
preferred.jp
株式会社Preferred Networks(本社:東京都、代表取締役 最高経営責任者:西川 徹、以下、PFN)は、PFNが日本語翻訳に特化してフルスクラッチ開発した大規模言語モデル(LLM) PLaMo™翻訳 のブラウ […]
0
161
0
RT @mhagiwara: A Healing Break for My Brave Girl. Our 12-year-old daughter has been bravely battling osteosarcoma (bone cancer) since Janua….
0
5
0
RT @Alibaba_Qwen: 🦥 Qwen3-Coder-Flash: Qwen3-Coder-30B-A3B-Instruct.💚 Just lightning-fast, accurate code generation. ✅ Native 256K context….
0
432
0
RT @Alibaba_Qwen: 🚀 Qwen3-30B-A3B Small Update: Smarter, faster, and local deployment-friendly. ✨ Key Enhancements:.✅ Enhanced reasoning,….
0
276
0
RT @bo_wangbo: Finally, a 45 page literature review of text embedding model, datasets, evaluation and training methods: .
arxiv.org
Text embeddings have attracted growing interest due to their effectiveness across a wide range of natural language processing (NLP) tasks, such as retrieval, classification, clustering, bitext...
0
52
0
RT @ricepamo: こちらの記事の最後でも触れていただいてますが、Wavehaxの改良版を来月のInterspeechで発表します。.サブスケール生成導入による単純な性能向上に加えて、2D Conv化によるパラメータ数削減が、低遅延条件下での推論速度の改善に繋がりやすい….
0
7
0
RT @preferred_jp: 【ブログ】PLaMo 2シリーズの事後学習に関する解説記事を公開しました。long-context対応のための継続事前学習、LLMを用いた高品質なデータ生成、学習パイプラインの改良などの工夫を重ね、31B、8Bパラメータそれぞれのモデルで、高….
tech.preferred.jp
はじめに Preferred Networks (以下PFN) とグループ会社のPreferred Elements (以下PFE)
0
27
0
RT @takaito0423: タスク量的に順位争いは難しいので,出し惜しみせずBERTモデルを学習&推論させるとっておきのコードをディスカッションに投稿しました!!.SB Intuitionsが公開している日本語ModernBERTを使わせていただいております!.少しでもお….
0
5
0
RT @Alibaba_Qwen: 🚀 GSPO: Group Sequence Policy Optimization — a breakthrough RL algorithm for scaling LMs!. 🔹 Sequence-level optimization….
0
193
0
RT @wataru9871: 🚀 We just released Sidon — a multilingual speech restoration model built on the Miipher & Miipher-2 resynthesis framework!….
huggingface.co
0
21
0
RT @jungokasai: 私 @kotoba_tech のCTOの、 技術補佐的なことをしてくださる方を探しております!弊社音声AIモデル・APIの性能評価、品質管理、デモ、プロトタイピング、エラー分析など多岐にわたる業務をどんどん進んでやっていただける方だと最高です!ご….
0
9
0
RT @mhagiwara: ImmortalLM: 限りある命と向き合う AI 研究者の人生の記録 — Brain Dump of a Mortal AI Researcher.
immortallm.masatohagiwara.net
A voice journal by Masato Hagiwara. Thoughts on life, family, and meaning after a Stage IV lung cancer diagnosis.
0
17
0
MLSysで一緒に面白い開発をしていただける方を大募集中です!!まずはこの最高の記事を読んでいただいて、興味があればお声がけをぜひー!.
久しぶりに Zennで記事を公開しました!.@KeisukeKamahori ��� Kotoba を支える MLSys周りの最先端技術をまとめてくれました。ぜひご一読ください。.Kotoba では MLSys エンジニアの採用を最強化中です。.弊社 X のヘッダーからぜひご応募ください!.
0
2
19