Human APIはモバイルアプリをリリースし、AIシステムを大規模に実在の人間の入力と結びつけるための競争における新たな局面を切り開きました。 現在iOSとAndroidで利用可能なこのアプリは、貢献者がタスクを閲覧し、電話でそれらを完了し、提出がレビューされ承認された後に報酬を受け取れるようにします。 表面上はかなりシンプルなプロダクトです。しかしその下では、AIエージェントが必要とする人間が「ときどき」ではなく「プログラム的に」ますます増えていくという、より広範な賭けの一部でもあります。 エージェント経済における人間の仕事のためのモバイルレイヤー アプリ内の最初のタスクは音声に焦点を当てています。会話型のものもあり、ユーザーが「今日の調子はどうでしたか?」のようなプロンプトに対して自由に返答します。ほかにはスクリプト型があり、参加者に用意された対話文を音読するよう求めます。狭そうに聞こえるかもしれませんが、それはランダムではありません。スピーチは、人間が生成しやすく、なおかつ十分な自然なバリエーションをもってAIがそれを再現するのが難しいデータの、最もわかりやすい例の一つであり続けています。人間にとっては容易に生成できる一方で、AIにとっては自然な変化を伴う再現が依然として難しいのです。 Human APIは、その作業をよりアクセスしやすくすることが目的だと言っています。貢献者が特別な機材やデスクトップツールを用意する必要はなく、今はスマートフォンから直接課題を完了できます。これにより、特に現実の環境、アクセント、イントネーションの恩恵を受ける短尺の音声タスクにおいて、ハードルはかなり下がります。 Human APIの最高経営責任者(CEO)であるSydney Huangは、モバイルアプリにより「一人ひとりが持つ独自に人間らしいスキル」、そして「発話のニュアンス」から始めて、誰でもスマホさえあれば稼ぎ始められると述べました。 AIエージェントが仕事を依頼し、人間がそれを完了する 同社は、自社のより広いプラットフォームを「エージェントネイティブの調整レイヤー」として説明しています。実際には、これはAIシステムが、言語のニュアンス、現実世界でのやり取り、あるいは説得力をもって合成できないデータに関わるタスクに直面したとき、人間の入力を求められるということを意味します。 現時点では、モバイルアプリは音声収集に中心がありますが、Human APIは、コンピュータ利用データや、現実世界での実行を必要とするタスクなどへ拡大する計画だと言っています。これは、ギグアプリ以上の何かを示しています。エージェントがエッジケース、文脈、ニュアンスを人間へアウトソースし、その対価を従来の採用チャネルではなくソフトウェアのレールを通じて支払うような、市場のためのインフラのように見えます。