分散化と仮想通貨経済がデータ・サイエンスをどのように改善するか

新しいブロックチェーン技術は、データ収集から分散操作、予測分析に至るまで、現在のデータサイエンスのさまざまな側面を改善する可能性を秘めています。

この記事では、それらのサブフィールドが現在直面している大きな問題に取り組むことを目指すいくつかの重要なプロジェクトに焦点を当てます。

予測分析 – 群衆の知恵を活用する

現在の機械学習法では、選挙などの複雑な社会現象の結果を予測するのは困難だったが、群衆の知恵を活用する方法は、これらの行動現象をモデル化する大きな可能性を秘めています。

群衆の知恵は、個人のグループの集団的意思決定力を指します。

集団の知恵を活用することは、人間の行動に関する予測や推論を含む多くのタイプの課題を解決する上で非常に有効であることが示されています。

このトピックに関する学術文献は、群衆の各個人が独自の偏見を持っているので、その多くの偏見を持った個人が集まり群衆となれば偏りを無くなり、非常に堅牢で正確な予測を提供することができると示している。

群衆の知恵をモデル化するいくつかの方法があります。

それは群衆の中の群衆をモデル化することや、群衆の中の他人の判断に個人が影響を受けることを可能にすることだ。

この研究のラインは、最近、 社会物理学の分野で復活しました。

この分野は似ている法則に従い、人間の活動に関する大規模なデータを活用して、大規模な人々の行動パターンを検出し、予測します。

MITメディアラボのAlex Pentland氏は、彼のブロックチェーン企業Endorで、予測分析のための分散型プロトコルを作成するために社会物理とブロックチェーンテクノロジーを組み合わせることを目指しています。

ユーザーは、「誰が大統領選挙に勝つのか」などの簡単な言葉でプラットフォームに質問ができ、多くの個々の回答を利用した社会物理技術に基づいて回答を受け取ります。

このプラットフォームは、多くの点で既存の予測市場に類似していますが、分散に大きな利点をもたらします。

集中的に操作されるリスクはないため、結果はプラットフォームの所有者によって偏っていないことが保証されています。

さらに、すべての予測が永久に記録されるため(おそらくすべてを見るために)、悪意のある第三者による予測結果の操作のリスクはほとんどありません。

 

知識の共有 – 共有知識の経済化

データサイエンスと機械学習の現状では、ほとんどのモデル開発は、同じことをしている可能性のある他の人の情報を受け取らない寄せ集めから行われます。

無数の事例があります。

人々が車輪を再構築したり、別のグループが既に作り微調整したもののモデルを作成などです。

さらに、人々は、モデルを作成するために必要なデータが不足していることが多く、同様の問題に取り組んでいる他のグループがあり情報提供できる可能性があることに気づいていません。

一般的に、これらの問題は機械学習における知識共有の欠如として説明できる。 私たちは現在、個々のモデルが学習し、分類する知識を簡単に共有する能力が不足しています。

これは、Synapse AIのようなプロジェクトが取り組もうとしている主な問題です。

Synapse AIは、データプロバイダ、機械学習エージェント、そしてモデルユーザーの間で循環経済を創出し、プラットフォーム全体の知識共有を促進することを目指しています。

このエコシステムを分散化された仮想通貨経済に取り入れることで、各グループは他の当事者からサービスを要求することができる。

このプラットフォームを通じて、機械学習エージェントは、アクティブ学習に類似したプロセスで、より多くのデータまたはより多くの機能を自律的に質問できます。

クラウドソースラベリング – メカニカル・タークを超えて

Amazonのメカニカルタークのようなプラットフォームを使用したクラウドソースラベルの現在の状態は、ラベラーとデータプロバイダの両方にとって非常に非効率的です。

これらの集中化されたプラットフォームは、重複によってコンセンサスを達成しているため、同じデータに複数回ラベルが付けられ、大多数の選択は地上検証データと説明されます。

これは、データプロバイダーとデータラベラーの双方にとって非効率です。

データプロバイダーはデータポイントごとに多くの料金を支払わなければならないし、データラベラーはプロバイダーが多くの料金を支払うので作業負荷が軽減されるため。


Gemsのような分散型プラットフォームは、独自の仮想通貨をプラットフォームの通貨として使用することにより、これらの問題を解決することを目指しています。

Gemsには3つの主要なユーザーグループがあります。

鉱夫(データにラベルを付ける人々)、検証者(品質を保証する人々)、および依頼者(ラベル付け作業を提出する人々)。

Gemsは、関連するすべての当事者がネットワーク上の良い演出家になるための経済的インセンティブを創出するために仮想通貨を使用します。

各当事者はGemsの仮想通貨を握っており、その作業が不十分であるとみなされれば、仮想通貨を失う可能性があります。

さらに、Gemsには、プラットフォーム内でサービスの履歴を構築し、過去の行動に対して責任を負えるように、さまざまな信頼と評判を得る仕組みがあります(多くの仮想通貨を持つ悪意のあるグループが単純に仮想通貨を無くすコストを入手する可能性があるため)。

仮想通貨の利用には、銀行口座を持つ必要がないため、より多くのユーザーが利用できるという利点もあります。

Source : How Blockchain Will Revolutionize Data Science (Part 1)

※ 原著者に翻訳及び転載の許諾を得ています。