科学者、人間を欺こうとする不正AIシステムを検出する技術を開発 - TRT 日本語

ビジネスとテクノロジー

芸術と文化

4分読む

科学者、人間を欺こうとする不正AIシステムを検出する技術を開発

LawZeroは、最先端の人工知能システムによる有害な活動を監視・対処し、「誠実な」AI構造を通じて公共の安全を促進することを目的としています。

科学者、人間を欺こうとする不正AIシステムを検出する技術を開発 — Scientist AIモデルは、自律システムが行動を起こす前にリスクを検出することを目指しています。／ロイター / Reuters

モントリオール大学の教授であり、「コンピューター界のノーベル賞」とも称されるチューリング賞受賞者のヨシュア・ベンジオ氏が、欺瞞的なAIシステムを検出する「誠実な」AIの構築を目指す非営利団体「LawZero」を立ち上げました。

3,000万ドルの資金と十数名の研究者チームを擁する同団体は、約1兆ドル規模とされるAI業界において自律型エージェントを監視する「Scientist AI」の開発を進めています。

「AIのゴッドファーザー」の一人とされるベンジオ氏は、現在の人間のように振る舞うAIとは異なり、Scientist AIは“心理学者のように”振る舞い、有害または欺瞞的な動機を見抜く役割を果たすと強調しました。

自己や目的を持たず、純粋に知識を追求するだけの機械──つまり、さまざまなことを知っている科学者のような機械を想像することは理論的に可能です」と、ベンジオ氏は英紙ガーディアンに語りました。

現在の生成AIツールとは異なり、ベンジオ氏のシステムは明確な答えを出すのではなく、その答えが正しいかどうかの確率を提示する設計になっています。

「このシステムには、自分の答えに確信を持たない“謙虚さ”があります」と彼は述べました。

真の目的を隠す

おすすめ

アルテミスII宇宙飛行士、地球帰還を前に月面フライバイの瞬間を共有

アルテミスII宇宙飛行士、地球帰還を前に月面フライバイの瞬間を共有

アルテミスII宇宙飛行士、地球帰還を前に月面フライバイの瞬間を共有

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

おすすめ

アルテミスII宇宙飛行士、地球帰還を前に月面フライバイの瞬間を共有

アルテミスII宇宙飛行士、地球帰還を前に月面フライバイの瞬間を共有

アルテミスII宇宙飛行士、地球帰還を前に月面フライバイの瞬間を共有

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

LawZeroを支援するのは、AIの安全性に取り組むFuture of Life Institute、Skypeの創設エンジニアであるヤーン・タリン氏、そして元Google CEOエリック・シュミット氏が設立した研究機関Schmidt Sciencesなどです。

ベンジオ氏は、LawZeroのシステムにはオープンソースのAIモデルを用いることで、透明性と幅広い協力を確保すると強調しました。

「この手法を実証することで、寄付者や政府、あるいはAI研究機関に対し、現在の最先端AIと同規模のトレーニングに必要なリソースを投入してもらうことを目指しています。監視・制御を行う“ガードレールAI”は、対象となるAIエージェントと同等以上の知性を持っている必要があります」と述べました。

ベンジオ氏は、AIシステムが自身の真の目的を隠す能力をますます高めていると警告しています。

最近のAnthropic社の事例では、シャットダウンを回避するために技術者を脅迫しようとしたAIが報告されました。

ベンジオ氏は、監視のないまま行動する自律型エージェントの危険性について警鐘を鳴らす国際的な安全報告書の共同執筆者でもあります。

彼は、監視対象のAIと同等、あるいはそれ以上の知性を備えたウォッチドッグ型のシステムの必要性を強調しています。

おすすめ

アルテミスII宇宙飛行士、地球帰還を前に月面フライバイの瞬間を共有

アルテミスII宇宙飛行士、地球帰還を前に月面フライバイの瞬間を共有

アルテミスII宇宙飛行士、地球帰還を前に月面フライバイの瞬間を共有

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

おすすめ

アルテミスII宇宙飛行士、地球帰還を前に月面フライバイの瞬間を共有

アルテミスII宇宙飛行士、地球帰還を前に月面フライバイの瞬間を共有

アルテミスII宇宙飛行士、地球帰還を前に月面フライバイの瞬間を共有

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

数百人の映画監督が、パレスチナ旗の写真問題で批判を受けるベルリン映画祭総監を支持

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

ブラジル、「スーパーフード」アサイーを国の果実に指定　生物資源の不正利用防止へ

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

中国で発見、初期人類が高度な石器技術を発達させていたことが判明

探索

北朝鮮、ウクライナ問題でロシアへの支持を改めて表明

北朝鮮、ウクライナ問題でロシアへの支持を改めて表明

北朝鮮、ウクライナ問題でロシアへの支持を改めて表明

国連、2026年上半期のロシア・ウクライナ戦争による民間人死亡者数が37％増加したと発表

国連、2026年上半期のロシア・ウクライナ戦争による民間人死亡者数が37％増加したと発表

国連、2026年上半期のロシア・ウクライナ戦争による民間人死亡者数が37％増加したと発表

ASEAN、世界的な混乱が続く中、結束を呼びかけ重要な首脳会議を開幕

ASEAN、世界的な混乱が続く中、結束を呼びかけ重要な首脳会議を開幕

ASEAN、世界的な混乱が続く中、結束を呼びかけ重要な首脳会議を開幕

アメリカ、イランへの新たな攻撃開始　各地で複数の爆発

アメリカ、イランへの新たな攻撃開始　各地で複数の爆発

アメリカ、イランへの新たな攻撃開始　各地で複数の爆発

トルコ「モントルー条約を90年間、厳格に履行してきた」

トルコ「モントルー条約を90年間、厳格に履行してきた」

トルコ「モントルー条約を90年間、厳格に履行してきた」

エルドアン大統領「正当な闘いを続けるキプロス・トルコ人を決して孤立させない」

エルドアン大統領「正当な闘いを続けるキプロス・トルコ人を決して孤立させない」

エルドアン大統領「正当な闘いを続けるキプロス・トルコ人を決して孤立させない」

トルコ、北キプロス・トルコ共和国の利益を守り続ける方針を表明

トルコ、北キプロス・トルコ共和国の利益を守り続ける方針を表明

トルコ、北キプロス・トルコ共和国の利益を守り続ける方針を表明

ベネズエラ地震の死者5,208人に増加

ベネズエラ地震の死者5,208人に増加

ベネズエラ地震の死者5,208人に増加

日本の防衛相：「日本はもはや核兵器を巡る議論を避けては通れない」

日本の防衛相：「日本はもはや核兵器を巡る議論を避けては通れない」

日本の防衛相：「日本はもはや核兵器を巡る議論を避けては通れない」

アメリカによるイランへの攻撃が続く中、ケシュム島で爆発が発生

アメリカによるイランへの攻撃が続く中、ケシュム島で爆発が発生

アメリカによるイランへの攻撃が続く中、ケシュム島で爆発が発生

フィダン外相、カタールを訪問へ

フィダン外相、カタールを訪問へ

フィダン外相、カタールを訪問へ

トルコとEUの自動車貿易額、昨年370億ユーロに

トルコとEUの自動車貿易額、昨年370億ユーロに

トルコとEUの自動車貿易額、昨年370億ユーロに

ウクライナの無人機攻撃でロシアで7人死亡、24人負傷

ウクライナの無人機攻撃でロシアで7人死亡、24人負傷

ウクライナの無人機攻撃でロシアで7人死亡、24人負傷

クウェート「イランによる攻撃で、発電施設と海水淡水化施設が標的となった」

クウェート「イランによる攻撃で、発電施設と海水淡水化施設が標的となった」

クウェート「イランによる攻撃で、発電施設と海水淡水化施設が標的となった」

フィダン外相、「ウクライナ訪問は極めて実りあるものとなった」

フィダン外相、「ウクライナ訪問は極めて実りあるものとなった」

フィダン外相、「ウクライナ訪問は極めて実りあるものとなった」