Taku Kudo Profile
Taku Kudo

@taku910

Followers
5K
Following
820
Media
95
Statuses
5K

形態素解析などなど

Joined July 2009
Don't wanna be here? Send us removal request.
@taku910
Taku Kudo
4 days
真夏の野沢。青看板の本来の高さを知る。
Tweet media one
Tweet media two
0
0
3
@taku910
Taku Kudo
5 days
RT @rtokuhisa: #YANS2025 聴講のみでの参加募集を開始しました。. 工藤拓氏( @taku910 )、 落合陽一氏(@ochyai)のチュートリアル講演の他、第一線で活躍される方の招待ポスターなど見どころ満載です。..
Tweet card summary image
yans.anlp.jp
第20回言語処理若手シンポジウム(YANS2025)のプログラム概要です.
0
7
0
@taku910
Taku Kudo
6 days
Free-Threading を使って sentencepiece の tokenization を並列に動かせますが、バッチリクエストを投げると Native Thread で処理してくれて、そちらのほうが2倍ぐらい高速です。同じ sentencepiece instance を並列にアクセスできる(ただし const method のみ) 以上の利点は現状ありません。.
0
1
5
@taku910
Taku Kudo
6 days
今どきは、言語自身がビルドやデプロイのエコシステムを内包することが多いが、一長一短だなと。開発者はその恩恵を受けるかわりに、その暴君に一生身を捧げないといけない。平気で互換性や機能が壊される。C++は互換性は担保されるし、インフラはユーザ任せなので tar-ballでも20年耐えられる。.
0
0
13
@taku910
Taku Kudo
6 days
Free-Threading(NoGIL)移行は結構大変に見える。C++のmutableメソッドをスレッド下で動かしたいなら、呼び出し側がロックしろが原則 (スレッド互換) 。GIL がこのロックを担当してたが、GIL無しだと安易なマルチスレッドコードは軒並みクラッシュ。C++的には仕様通りだがWrapper開発者の責任なのか?.
0
2
11
@taku910
Taku Kudo
6 days
先週の土日奇跡的に空き時間とれて sentencepiece の更新作業を始めたが、結局なんやかんやで 10日ほどかかった。影響範囲的に非公式+1人プロジェクトがそろそろ限界。昔はお気楽に作業できたけど.
0
3
12
@taku910
Taku Kudo
6 days
We've released SentencePiece 0.2.1 (including the pip wheels). This update adds support for Python 3.13/14 and experimental support for Free-Threading (NoGIL). We apologize for the delay in this update.
Tweet card summary image
github.com
Major changes [Python] Supported wheels and builds for Python 3.13 and 3.14(rc0) #1134, #1127, #1121, #1111, #1110, #1104, #1103, #1099, #1091 [Python] Added an experimental support for free-threa...
0
7
40
@taku910
Taku Kudo
10 days
三男くん、本日吹奏楽コンクール。昨日まで午前吹奏楽、午後柔道でクタクタなはず。ちなみに楽器はピッコロ/フルート。柔道体型からのギャップが激しい.
0
0
0
@taku910
Taku Kudo
12 days
次男くんは、5日間都内で柔道合宿。三男は午前中吹奏楽部活で、午後通いで柔道参加。三男にプロテインの差し入れをことづけるなど。.
0
0
1
@taku910
Taku Kudo
14 days
次男くん、金鷲旗から帰ってきてすぐNZ海外研修。今日帰国で明日から柔道合宿。体もつのか。.
1
0
3
@taku910
Taku Kudo
23 days
白馬全山シーズン券購入。廃人予定.
0
0
1
@taku910
Taku Kudo
27 days
次男覚醒して 5人抜き敢闘賞。.
@taku910
Taku Kudo
28 days
某有名柔道大会に次男出るので家族総出で福岡(実家)入り。三男と福間海岸に行きました。.
1
0
17
@taku910
Taku Kudo
28 days
某有名柔道大会に次男出るので家族総出で福岡(実家)入り。三男と福間海岸に行きました。.
0
0
3
@taku910
Taku Kudo
1 month
野暮用で長野入り。相変わらず走ってます。北アルプスきれい。もやってるけど。
Tweet media one
0
0
3
@taku910
Taku Kudo
2 months
Gboardも以前は候補を拡張しなが辞書引きしていました。現在のタイプミス修正は、読み修正(前処理)として実装しています。実装は非OSSですがTransfomerが動いています。読みレベルなので探索空間は小さくできます。.
Tweet card summary image
github.com
Mozc - a Japanese Input Method Editor designed for multi-platform - google/mozc
@miwa_ensan
Miwa - azooKeyの開発者
2 months
この最適化の要点は、今まで「訂正候補を列挙」→「各候補について辞書を引く」とやっていたところを「訂正候補を列挙しながら辞書を引く」と並行にすることで不要な候補の列挙を抑えてキャッシュを効かせる一石二鳥戦略なんだけど、テストケースによっては1.6倍くらい速くなった.
1
8
33
@taku910
Taku Kudo
2 months
長男たちと合流して万博弾丸ツアー。日本館と花火見て混雑避けるため駅までダッシュ。滞在時間三時間未満。.
0
0
3
@taku910
Taku Kudo
2 months
手のりケルヒャーほしい。春スノボで硫安落とすのに使いたい。ペットボトル+水で十分だと思うけど気分の問題?.
0
0
2
@taku910
Taku Kudo
2 months
今年からMozcのコードを大幅にいじっています。歴史的な経緯からデスクトップのサジェスト機能のサブセットとしてモバイル向けデコーダが実装されてました。現状if-else で処理を分割しています。ただモバイル向けの改善が主軸になり副作用なく共存するのが困難になってきたため分離をすすめています。.
0
6
70