bioshok(INFJ)
@bioshok3
Followers
30K
Following
70K
Media
2K
Statuses
20K
AI Safety/Governance/Alignment/National security/Singularity/Superintelligence/AGI/X-Risk/prediction https://t.co/MuWGjduDIO mbtiの哲学はhatenablog
東京 新宿区
Joined July 2017
現代における重大な潮流として急速に注目を集めているAIがもたらす深刻なリスクとその歴史的背景について、約14万字の記事を公開します。AIの脅威に関する論理、その歴史的背景、技術的対応策(AI Alignment研究)および政策的対応策(AIガバナンス)について総合的に執筆させていただきました。
23
367
1K
Anthropicの新たな研究で報酬ハッキングを抑えるためには学習時には「この環境では報酬ハッキングが許可されている」とプロンプトして、本番環境では「報酬ハックするな」と言うと報酬ハッキングが減ることが分かった。また同時に他のミスアライメントリスクも大幅に減る。
New Anthropic research: Natural emergent misalignment from reward hacking in production RL. “Reward hacking” is where models learn to cheat on tasks they’re given during training. Our new study finds that the consequences of reward hacking, if unmitigated, can be very serious.
0
7
54
Anthropicの新たな研究で報酬ハッキングを抑えるためには学習時には「この環境では報酬ハッキングが許可されている」とプロンプトして、本番環境では「報酬ハックするな」と言うと報酬ハッキングが減ることが分かった。また同時に他のミスアライメントリスクも大幅に減る。
New Anthropic research: Natural emergent misalignment from reward hacking in production RL. “Reward hacking” is where models learn to cheat on tasks they’re given during training. Our new study finds that the consequences of reward hacking, if unmitigated, can be very serious.
0
7
54
Stargate計画リプツリーに追記。 https://t.co/oKeZdLvU4X
ソフトバンクはオハイオ州ローズタウンにある電気自動車工場の改修に最大30億ドルを投資する計画。OpenAIのモジュール式データセンターの生産工場となる。モジュラー方式で移動可能な構造で現場で容易に設置可能にすることにより、通常のDC建設期間の12カ月を7-8カ月に短縮することが可能。
0
0
2
ソフトバンクはオハイオ州ローズタウンにある電気自動車工場の改修に最大30億ドルを投資する計画。OpenAIのモジュール式データセンターの生産工場となる。モジュラー方式で移動可能な構造で現場で容易に設置可能にすることにより、通常のDC建設期間の12カ月を7-8カ月に短縮することが可能。
OpenAI's CEO aims for 250 gigawatts of data center capacity by 2033, a figure equivalent to about one-third of current U.S. peak power consumption. Full details here:
0
8
15
中国がAGI開発競争で勝つ「AI2032」シナリオが公開された。ASIタイムラインがAI2027よりも8年遅いこと、中国のエネルギー、ロボット、製造能力への大規模な投資とその圧倒的な物量でコンピューティング能力も米国のそれを上回られることで4ヶ月早く中国が先に超知能を開発し、銀河全体の90%が中共の支
Who wants more AGI scenarios? I do! My colleague @romeovdean spent three days as a side-project writing up an "AI 2032" scenario. There's also some nice meta-discussion of the writing process and what he learned from it.
10
73
258
ソフトバンクはオハイオ州ローズタウンにある電気自動車工場の改修に最大30億ドルを投資する計画。OpenAIのモジュール式データセンターの生産工場となる。モジュラー方式で移動可能な構造で現場で容易に設置可能にすることにより、通常のDC建設期間の12カ月を7-8カ月に短縮することが可能。
OpenAI's CEO aims for 250 gigawatts of data center capacity by 2033, a figure equivalent to about one-third of current U.S. peak power consumption. Full details here:
0
8
15
雰囲気がGoogleが勝つ、tpuもあるからコストも安いとなってるところを、冷静に今後のStargate計画の進展からそうとも言い切れないし(短期的にはGoogle優位だった)、むしろopenaiのほうが今後数年はぐいっと計算資源増えるので優位にまたなる可能性もあるのではないかと感じる。コストの問題は売上が
1
43
188
茂木敏充外相は21日の記者会見で、全ての大使館 と政府代表部に「AI(人工知能) 政策担当官」を置 くと発表した。 各国の政策把握や、2国間協力の推進を担う。茂木氏は「AIは安全保障にも直結する外交上の重 要分野だ」と強調した。 https://t.co/R28H4ACC0m
news.yahoo.co.jp
茂木敏充外相は21日の記者会見で、全ての大使館と政府代表部に「AI(人工知能)政策担当官」を置くと発表した。 各国の政策把握や、2国間協力の推進を担う。 茂木氏は「AIは安全保障にも直結す
0
0
3
OpenAIも今後Googleに計算資源的にまだまだ負けてない可能性も追記。 https://t.co/cRe5vrgMDN
雰囲気がGoogleが勝つ、tpuもあるからコストも安いとなってるところを、冷静に今後のStargate計画の進展からそうとも言い切れないし(短期的にはGoogle優位だった)、むしろopenaiのほうが今後数年はぐいっと計算資源増えるので優位にまたなる可能性もあるのではないかと感じる。コストの問題は売上が
0
0
4
OpenAIは計算資源的に今後優位になる可能性も追記。 https://t.co/cRe5vrgMDN
雰囲気がGoogleが勝つ、tpuもあるからコストも安いとなってるところを、冷静に今後のStargate計画の進展からそうとも言い切れないし(短期的にはGoogle優位だった)、むしろopenaiのほうが今後数年はぐいっと計算資源増えるので優位にまたなる可能性もあるのではないかと感じる。コストの問題は売上が
0
4
10
雰囲気がGoogleが勝つ、tpuもあるからコストも安いとなってるところを、冷静に今後のStargate計画の進展からそうとも言い切れないし(短期的にはGoogle優位だった)、むしろopenaiのほうが今後数年はぐいっと計算資源増えるので優位にまたなる可能性もあるのではないかと感じる。コストの問題は売上が
1
43
188
Max Tegmark氏(MT)と元ホワイトハウス政策顧問のDean Ball氏(DB)による超知能開発の禁止に関するディベート。
Doom Debates presents @tegmark vs. @deanwball: “Should we ban superintelligent AI development?” Arguing FOR banning superintelligence until there's a scientific consensus that it'll be done safely and controllably and strong public buy-in: 👤 Max Tegmark is an MIT professor,
0
0
10
Doom Debates presents @tegmark vs. @deanwball: “Should we ban superintelligent AI development?” Arguing FOR banning superintelligence until there's a scientific consensus that it'll be done safely and controllably and strong public buy-in: 👤 Max Tegmark is an MIT professor,
19
18
90
サム・アルトマン氏は先月、同僚らに対し、グーグルの最近の進歩は「当社にとって一時的な経済的逆風となる可能性がある」と語り、しかしOpenAIが先行すると付け加えた。「Shallotpeat」と呼ばれるモデルで今後数ヶ月着実に前進していくと保証した。
theinformation.com
OpenAI CEO Sam Altman told colleagues last month that Google’s recent progress in artificial intelligence could “create some temporary economic headwinds for our company,” though he added that OpenAI...
12
155
798
Gemini3 proは性能は飛躍してるが安全性についてはほかモデルより劣ってるスコア。 https://t.co/czeIiLFIVe
However on safety – jailbreaks, bioweapons assistance, overconfidence, deception, agentic harm – Gemini is worse than GPT, Claude, and Grok (here a lower score is better).
1
1
2
OpenAIはGPT-5が数学、物理学、生物学、材料科学の分野における科学研究を加速させた13の事例を示す論文を公開。これらの事例のうち4つにおいて、GPT-5はこれまで未解決だった問題の証明を見つけるのに役立った。 https://t.co/6sMXyDZFFK
💥 Today we say “hello world” from OpenAI for Science. We’re releasing a paper showing 13 examples of GPT-5 accelerating scientific research across math, physics, biology, and materials science. In 4 of these examples, GPT-5 helped find proofs of previously unsolved problems.
0
0
6
Noam Brownのこの指摘もシャロットピートの話かもしれない。 https://t.co/8RouqR8TvE
Today we at @OpenAI are releasing GPT-5.1-Codex-Max, which can work autonomously for more than a day over millions of tokens. Pretraining hasn't hit a wall, and neither has test-time compute. Congrats to my teammates @kevinleestone & @mikegmalek for helping to make it possible!
1
1
12