Adsrekt

あなたのAIエージェントは現在完全なルートアクセス権を持っています
幻覚のコマンド一つで十分です
> sudo rm -rf /
それは理論上の話ではありません
エージェントループは、あなたが制御できないコンテキストウィンドウからシェルコマンドを生成します。モデルは悪意を持つ必要はありません。
ただ一度間違えば良いのです。

原文表示

2 いいね

報酬
2
コメント
リポスト
共有

Adsrekt

9時間前

あなたの電話は、あなたの妻よりもあなたのことをよく知っている。
暗号で支払われた使い捨ての電話は、履歴も身元もなく、束縛もない。
本人確認のセルフィーも不要。銀行口座もリンクしない。深夜3時のどの取引所が召喚状を受け取ったかの不安もない。

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

Adsrekt

15時間前

Pythonが「メモリを自動的に管理してくれる」という神話が、あなたのエージェントが稼働4時間でOOM（メモリ不足）になる原因です
先月、24のマルチエージェントを並列で実行し、1つのセッションの10倍のトークンを消費しながら、全く使い物にならない出力を出しました
本当の問題はトークンではなく、誰も監視していなかったメモリです
Pythonは参照カウントと循環ガベージコレクターを使用しています。問題は、C拡張を通じてnumpy配列をロードし、参照を適切に減らさない場合に起こります。これらのオブジェクトは一度も収集されません。放置され、増え続け、静かに蓄積します
長時間稼働しているエージェントが処理するたびに、もう一つのテンソル割り当てが発生し、それが解放されない可能性があります。それを24の同時セッションで掛けると、良い日でも1時間あたり400MBのリークになります
> もっとRAMを増やせ
そうすれば、tracemallocが10分で捕捉できたはずの問題に対して、月30,000ドルの計算コストがかかるだけです

原文表示

報酬
いいね
コメント
リポスト
共有

Adsrekt

03-04 13:56

あなたのAIはブラックボックスであり、そのためにあなたの財布を圧迫します
機械的解釈性は、LLMを開けて内部の実際の回路をマッピングする方法です
雰囲気のテストではありません
「うまくいっているように見える」ではありません
実際のニューロンレベルでのトレーシングによるモデルの論理実装の追跡です
今、あなたのエンドポイントに到達するトラフィックの96％は、HTMLの生データを読むボットです
あなたのモデルは、監査できず、追跡できず、説明できない意思決定を行っています
そして、それに実資本の鍵を持たせているのです
企業のAI安全チームは、自分たちのモデルの仕組みを理解していません
彼らはそれをRLHFで包み込み、それを「整列」していると呼びます
それは安全性ではなく、マーケティングです
本当の課題はスケールです - 数十億のパラメータを持ち、私たちは今のところ小さな回路しか解釈できません
しかし、その小さな回路はすべてを教えてくれます
どのニューロンが価格データに反応するのか
どのニューロンがあなたのRAGコンテキストを完全に上書きするのか

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

Adsrekt

03-04 13:17

Anthropicの収益ランレートはついに$20 BILLIONに達しました
>$9 billionは2025年末までに予測
>$14 billionは数週間前
>$19 billionは今
彼らは数週間で$5 billionを追加しました
それは成長ではなく、巨大なAPI契約が同時に成立していることを除けば、理解できない速度でのエンタープライズ採用です。

原文表示

報酬
いいね
コメント
リポスト
共有

Adsrekt

03-04 11:02

私は同時に24セッションのマルチエージェントセッションをcodexで実行しました
openai、何だこれ？
1つのタブの10倍のトークン数
出力は1つの集中したプロンプトに対して全く改善されませんでした
> 「エージェント間の協力からの出現行動」
そう、出てきたのは私の請求書でした
あなたはエージェントがお互いに話すためにお金を払っているだけで、何かを生み出すためではありません
エージェントAがエージェントBのために要約し、エージェントCが再フォーマットし、エージェントDに渡し、最終的にあなたが14秒で得られたのと同じjsonを出力します
それはアーキテクチャではなく、計算の劇場です

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

Adsrekt

03-04 04:10

私は同時にcodexで24のマルチエージェントをオンにしました
ひどいです
24のエージェントが並行して動作し、1つのセッションの10倍のトークンを消費しながら、1つのタブと明確なプロンプトから得られるものと全く同じ結果を生み出さない
これはエージェントフレームワークではありません。トークン炉とローディングスピナーです
OpenAIは未来のように見える機能をリリースしましたが、ちょっと目を細めて見ればそう見えるだけで、実際に何かを構築しようとすると、すべてのエージェントがただ同じコンテキストを何度も繰り返し自分に言い聞かせているだけで、あなたの予算を食いつぶしていることに気づきます
「iT's JuSt EaRlY」- なるほど、昨日より少ないものをやるベータに10倍の金を払っているわけです
今の大手テックの「エージェント的」セールストークはUXの演劇に過ぎません。きれいなダッシュボード、並行スピナー、出力ゼロ。

原文表示

2 いいね

報酬
2
1
リポスト
共有

ybaser

月へ 🌕

Adsrekt

03-03 14:56

OpenClawは役に立たない？
実際に使ってみるまでは何も書きたくなかったので、使ってみて、構築して、ワークフローをテストして、正直な時間を費やした。
これが誰も求めていなかった正直なレビューだ。
今のAIエージェント周りのシーンは、友達同士のグループチャットの競争のように感じる。誰のエージェントがクールに聞こえるか、誰のデモがスリックに見えるか、誰のスクリーンショットがより多くのいいねを獲得するか。
しかし、実際に座ってopenclawを使って何かをシンプルにしようとすると、- ワークフローのステップを置き換えるか、手動のプロセスを削減するか - それはできない。
ステップを追加し、新しい依存関係を作り出す。結局、自分が作ったものを面倒見ながら時間を節約しようとする羽目になる。
それはツールではなく、松葉杖だ。
「これがXを置き換えて、二度と戻らない」ようなユースケースを見つけたかった。実際に何時間も探したが、まだ見つかっていない。
もしかしたら、見つかるかもしれない。

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

Adsrekt

03-03 11:40

ほとんどの人がAIエージェントについて話しているが、実際に作ったことがある人はほとんどいない
こちらが現時点の実際のアーキテクチャだ
ツール呼び出しエージェント = LLMブレイン + 機能レジストリ + 実行ループ
ツールは構造化されたスキーマとして定義する。モデルはどのツールを呼び出すかを選び、引数を渡す。あなたのランタイムがそれを実行し、結果をフィードバックする
これが全てのループだ。魔法はない
langchainやOpenAIのファンクションコールのような現代的なフレームワークがルーティングを処理する。VertexやBedrockのようなクラウドMLプラットフォームは推論のスケーリングを管理し、アイドル状態のGPUに無駄なコストをかけない
Qwen 3.5の小型モデル - 0.8Bから9Bパラメータ - はツール呼び出しをローカルの単一ノードで実行可能。同じ基盤を持つ大規模モデルと比べて計算量が少ないだけだ
エッジの本質はAIが存在することを知ることではなく、ツールをループに組み込み、実際に出力を出せるようにすることだ
もし今エージェントを作っているなら、使っているフレームワークをやめてしまえ

原文表示

報酬
いいね
コメント
リポスト
共有

Adsrekt

03-02 12:56

CLAUDEがダウンしています
今、どうやってnpm run devを書けばいいかわからない

原文表示

2 いいね

報酬
2
コメント
リポスト
共有

Adsrekt

03-02 04:18

世界は変わった
旧プレイブックは
エンジニア4人を雇う
20万ドルを使い果たす
9ヶ月で出荷する
誰かが気にかけてくれることを祈る
CLAUDE CODEはあなたの製品全体をたった1午後で構築する
あなたは機械と話す
それはあなたが説明するものを作る
同じ日に実際の人間でテストする
ピッチデックも
スプリント計画も
待つ必要もない
これを理解している創業者はすでに3つの製品を作り終えている一方で、他の人はまだ「検証中」
醜くても高速なバージョンが勝つのは、それが存在するから
あなたの洗練されたものは負ける、それが存在しないから
まだ計画を立てて出荷していないなら、すでに今朝始めた誰かに遅れをとっている

原文表示

報酬
いいね
コメント
リポスト
共有

Adsrekt

03-01 11:31

インターネットの96％は今やボットです
それについて考えてみてください
あなたが行うすべてのマーケティング戦略
あなたが行うすべてのコンテンツプレイ
あなたは機械と話しているのです
昔のやり方はツールでした
より良い広告、より良いSEO、より良いファネル
すべて人間に届くように作られていました
しかし、100人の訪問者のうち96人が
人間でないとしたら
あなたのツールはただ
空の部屋のためにパフォーマンスしているだけです
誰も話さないシフトは
ツールから意図へと移行しています
ツールは配信を最適化し
意図は信号とノイズをフィルタリングします
あなたは尋ねるのをやめます
「どうやってもっと多くの人に届くか」
代わりに尋ね始めます
「ボットの壁の背後にある本当の意図をどうやって検出するか」
同じことが現場でも起きています
ボリュームは偽装可能です
ウォレットの活動も偽装できます
しかし、実際の購買意図は
パターンを残し、ボットは模倣できません
もしあなたの戦略が
デフォルトで人間の観客を前提としているなら
それは嘘の上に築かれています
今適応している人たちは
指標ではなく意図を読んでいます。

原文表示

2 いいね

報酬
2
コメント
リポスト
共有

Adsrekt

03-01 08:01

あなたは6ヶ月かけて完璧な購入ボタンを作り上げました
LLMはそれを一度も見たことがありません
HTMLを読み取って次に進むだけです
今、インターネット上には人間1人に対して96のボットがいます
あなたの200の攻撃的なバナーは、実際のトラフィックのわずか4％にしか届きません
残りの96％は、生のコードブロックを何十億ものページと区別できません
色彩理論は関係ありません
緊急性を煽るコピーも関係ありません
TikTokのファネルも関係ありません
人々はすでに夕食に何のトマトソースを買うべきか尋ねています
彼らはその答えを信頼しています
彼らはそれに書かれたものを購入します
では、実際に誰に販売しているのでしょうか
エージェントは今、ウェブ上で脅威として扱われています
Cloudflareは彼らをブロックします
キャプチャは彼らを拒否します
ファイアウォールは彼らを禁止します
それは、ボットが攻撃を意味していた時代には理にかなっていました
しかし、エージェントは今や財布を開いている側になりつつあります
次の購入ボタンは、あなたのグラデーションを見ることのない何かに売る必要があります

原文表示

報酬
いいね
コメント
リポスト
共有

Adsrekt

02-28 14:52

インターネットはツールの販売をやめた
今は意図を売っている
パート2. B2Cについて
誰もExcelの表を10000行も並べ替えたくない
パラメータを設定する
ドキュメントを読む
エラーを修正する
彼らはこう言いたい
「100ドル持っていて、それを増やしたい」
そして結果を得たい
古いインターネットは未加工の部品のフィールドを提供していた
自分で何かを作り
次の人に売った
彼は自分のバージョンを返した
AIはそのループを殺した
誰もが同じトップモデルにアクセスできるとき
優位性はツールではない
優位性は意図と結果の間の摩擦を取り除くことだ
金融は最も明確な例だ
人々は5年間チャートを読むことに時間を費やしたくない
彼らは欲求を表明し、他の何かにリスクを任せたい
大企業はこれを5〜10年かけて理解しないだろう
彼らは遅い動きだ
すべてを委員会で決める
今、パイはそこに座っている
そしてほとんど誰も食べていない

原文表示

1 いいね

報酬
1
コメント
リポスト
共有

Adsrekt

02-28 08:14

誰もあなたのソフトウェアを必要としていません。あなたの仕事を売りましょう。
コードは毎月安くなっています。ソフトウェアは使い捨てになりつつあります。取引からNFTコレクションを生成するアプリが必要ですか？2つのプロンプトで永遠に完了です。
企業はあなたのソフトウェアに関心がありません。それは彼らのHRの10人を20％高速化するだけです。彼らはツールを必要としているのではありません。結果を求めています。
シンプルなシフト—ツールを売る代わりに、完成した仕事を売るのです。そして、あなたは従業員の効率ではなく、彼らの仕事そのものを競っています。
例
企業は候補者と履歴書の要件を送ります。あなたのAIはフルサイクルを行います—フィルタリング、選定、初期質問、創業者との面接スケジューリング。10人の人を雇う必要はありません。1人のマネージャーを残し、仕事をAIにアウトソースしましょう。
成果に基づく価格設定。ダッシュボードへのアクセスではなく、結果に対して料金を請求します。
松葉杖を売るのはやめましょう。解決策を売りましょう。

原文表示

2 いいね