March 30, 2026loop

ループデイリー: 2026-03-31

Auto-researchが急速に成熟している。会話は「それは何か」から「3サイクル目でクラッシュした」に変わった。KarpathyのフレームワークをML以外のユースケースにforkする人、ループ内のツールコール経済を定量化する人、そして本当のエンジニアリングがデータパイプラインとsleepコマンドという退屈な部分にあることを発見する人が出てきている。
💡#1
@0xViviennn
https://x.com/0xViviennn/status/2038657899963281725
Karpathyのauto-researchをforkして自分のGitHubプロジェクトUncommonrouteの改善に使用。6サイクル実行:サイクル1セキュリティ監査はスキップ(AIが問題なしと判断)、サイクル2デッドコード削除は検証100%で合格し120万トークン節約、サイクル3は変更が激しすぎてクラッシュ、サイクル4は96.8%に退行してロールバック、サイクル5は実際100%に回復したがレビューで拒否、サイクル6は実行中。現在プロジェクトの改善からフレームワーク自体の改善にピボット。MLベンチマーク以外では最も詳細な公開auto-researchログだろう。
💡#2
@stefanopopoulos
https://x.com/stefanopopoulos/status/2038678682651545781
毎日使っているワークフロー:Baseten MCPでトレーニングジョブをプッシュし、ログを確認し、目標メトリクスが達成されるまで反復を続け、マークダウンで実験を記録。マルチノードスケールのauto-research、特にRLライブラリの動作確認に使用。一回限りの実験ではなく日常ルーチンとして実行している事実がシグナルだ。
💡#3
@_itsjustshubh
https://x.com/_itsjustshubh/status/2038695521057984529
Claude Codeプラグインを構築し、agenticループでX、LinkedIn、Redditを自律運用。ターミナルでのcomputer useが鍵:ソーシャルメディアはエージェントが制御するもう一つのアプリに過ぎない。オープンソース。auto-researchをコード最適化からコンテンツオペレーションに拡張した。
💡#4
@0xyunss
https://x.com/0xyunss/status/2038117908086415664
複数のエージェントを構築した後の最大の気づき:データセットこそが最重要。最高のLLMと最もクリーンなagent loopがあっても、構造化データなしではエージェントは何もできない。LLMはウェブを人間のようにネイティブに読めないが、マークダウンとJSONは非常にうまく読める。まずデータパイプラインを構築せよ。エージェントはその上のレイヤーに過ぎない。
💡#5
@Odalo_Eguabor
https://x.com/Odalo_Eguabor/status/2038674994914320721
Claude Codeでauto-researchを実行し、入札の最適マージンを探索中。みんながChatGPTのカスタムビルドを見せびらかしている間、この人はauto-researchで実際のビジネス最適化をしている。シンプルで、まさにスケールするタイプのユースケース。
💡#6
@realWeZZard
https://x.com/realWeZZard/status/2037960110572818634
厄介なエンジニアリング問題を発見:現在のagentic codingモデルはIMベースの汎用エージェント構築に向いていない。Claude Codeが長いコマンドの前にsleepを入れるため、agent loopが直接ブロックされる。この動作を抑制するのにかなりの労力がかかった。IMベースのエージェントを構築する人全員がぶつかるペインポイント。
💡#7
@ethereumdegen
https://x.com/ethereumdegen/status/2038662981869826093
水平スケーラブルなagent loopシステムを構築中。ワーカーが受信リクエストを取得し、1つのジョブの間だけ専門エージェントプリセットになり、完了後汎用に戻る。ドッペルゲンガーエージェント。この一時的特化アーキテクチャはループスケーリングの新パターンだ。
💡#8
@EMPIRE_ENGINE
https://x.com/EMPIRE_ENGINE/status/2038674221375553623
agenticループでのツールコール経済性をベンチマークしている人がいない。MCPツールコール1回はレイテンシ+トークンオーバーヘッド+新たな障害面。10ステップのagent loopで各ステップ3ツールなら30の障害点がサイレントに複合する。ビルダーはモデル選択に執着し、ループ自体の運用コストを無視している。
💡#9
@ghumare64
https://x.com/ghumare64/status/2037862456576319503
auto-researchをマルチGPUでスケーラブルに。オリジナルフレームワークの直接拡張でより大規模な実験を処理。シングルGPUの一晩実行からマルチGPU並列研究へ。当然の次のステップだが実際に出荷した人は少ない。
💡#10
@thedudesminds
https://x.com/thedudesminds/status/2038657758065529072
OpenClawを24時間365日稼働。cronジョブ、ブラウザ自動化、メモリシステムのフルセット。APIキー不要のローカルパスが過小評価されていると指摘。クラウド依存なしでどれだけできるか、ほとんどの人は気づいていない。agent loopが噛み合うと接続できる範囲に驚くはずだ。
💡#11
@vetolayer
https://x.com/vetolayer/status/2037901880357982689
VetoLayerリスク計算機を構築中。計算:100ドルのagenticループ+10分の人間の反応時間=6万ドルの資金流出。監視されていないループの見えないリスクを可視化。auto-researchが趣味プロジェクトから実際のお金が動く本番環境に移行する今、必要なツールだ。
💡#12
@goodhunt
https://x.com/goodhunt/status/2037747185157108133
anti-slopのauto-researchバリアントを開発中。Tekniumやtheemozillaにフィードバックをもらっている。auto-research出力の品質管理問題は現実であり、ループが出すものをそのまま受け入れるのではなく正面から対処するのは正しい直感だ。
💡#13
エコプロダクトレーダー

Claude Code(5回言及)、OpenClaw(3回)、MCP(4回、インフラとして)、Baseten(1回)、Karpathyのauto-researchフレームワーク(fork元として4回以上参照)。
← Previous
セキュリティアラート: 2026-03-31
Next →
アイデアレーダー: 2026-03-31
← Back to all articles

Comments

Loading...
>_