产业网 > 观点 > 正文

数据和算力如此珍贵,人工智能的未来在区块链上!

发布时间:2021-07-22来源:www.qyjxzxfwb.com 编辑:未知

广告位置(首页一通--图文)

对于中小型企业来讲,要解决算力资源问题最容易的方法是通过众包。众包这一定义从非常早之前便开始挑战传统经营管理模式,就像《圣经》中并不强壮的勇士大卫战胜巨人哥利亚一样,以小胜大、以弱胜强,使得计算资源服务愈加实惠、愈加容易获得。Uber 和 Airbnbs 就是通过众包存活下来的“大卫”的代表。人工智能 世界也注意到了这种出色的模式。Kaggle 平台的开发就是通过众包,借助海洋协议来采集数据。人工智能 生态系统很欢迎这种新办法。而 Raven 协议的目的就是将众包火炬传递下去,通过对空闲计算资源的充分借助,打造第一个真的去中心化、分布式的深度学习练习系统,使深度学习模型的练习更为经济。

因为没资本支出,Raven 所提供的计算服务的价格将远低于市场上的任何提供商。因为在贡献者 / 主机节点上没任何依靠,资源的获得将变得更为高效和快捷。用 Raven 的公司可以进行在线 人工智能 实验,并依据市场需要对 人工智能 商品进行规模化,而不需要将很多的钱投进硬件这个无底洞里。

统一的生态系统

经过几十年的进步,传统的神经互联网有关算法已进化为深度神经互联网,并在各种应用范围获得了巨大成功,特别是模式辨别范围。

在第一代和第二代数据区块链解决方法中,若用这种解决方法,可以减少访问带注释的水平数据的障碍,Raven 协议将解决这种由练习带来的本钱挑战。妨碍这条大家都知道的链得以维系的鸿沟,正被 Raven 协议抹平,而这条链的坚固程度取决于它最薄弱的环节。

Raven 协议成功打造起了去中心化、勉励性和安全的机器学习 / 深度学习模型练习机制。

数据和算力如此珍贵,人工智能的未来在区块链上! 数据和算力如此珍贵,人工智能的未来在区块链上!
Open人工智能 报告:AI与计算

由此产生的直接后果是:

在一个一般的、计算能力有限的计算机上练习一个 人工智能/ML 模型总是需要数周甚至数月的时间。对于更好的计算芯片的需要是一个需要考虑的本钱原因。密集和频繁地用高速计算资源来操作计算数据、计算和更新深度神经互联网中不同神经元的梯度,其需要的本钱总是是小型到中型公司和开发者没办法担负的。云计算在一定量上对这一问题有所帮,但获得云资源来支持 人工智能 研发仍是一笔难以负担的开支。现在,在绝大多数云计算平台上,每小时所需支付的金额都在 2.5~17 USD之间。

Raven 协议相较于其他相似规则的突出之处在于它处置异步更新及数据碎片的并行所产生的延迟的办法。这种延迟问题用其他策略没办法解决,而且延迟在模型练习过程中是一个主要耗时原因,可能会消耗数周甚至数月。即便是拥有很多计算资源,对这一问题也没有办法。另外,假如想要让数据达成并行化,用户需要拥有可处置庞大计算资源的平台。这一原因使得规模较小的用户群没办法访问该平台。

区块链生态系统 的美妙之处在于,它可以借助其他未用的资源,完本钱不可能进行的贸易资源的买卖,还可以使大家参加原本没办法参与的市场活动。从经济角度来看,它提升了对现有资源的借助率。

更长的新解决方法的出货时间,由于模型练习所需时间更长;

Raven 已经认识到,下面的最大问题是怎么样在生态系统中买卖已有合作者的数字虚拟货币。为确保用便捷,RAV 币将在 Raven 生态系统内和其他合作服务间均可买卖。所有人都仍可以在 Raven 内部用其他合作服务币。这可以使区块链中的其他 人工智能 社区积极参与 Raven 协议。
绝大多数人还没意识到,人工智能 社区中的一小部分人正在为使 人工智能 触手可得、为所有人所用而不懈努力着。这是由于他们坚信,人工智能 将会以大家可能想像不到的各种方法融入大家的生活,变成大家生活的一部分。常规的 人工智能 公司与想要在自己系统中应用 人工智能 的公司,都在努力用 人工智能 改变着大家的生活,但他们可能会因为资源的局限,难以大展拳脚。Raven 的目的就是帮如此的个人及公司,让他们可以经济地充分挖掘自己在 人工智能 方面的潜力,达成 人工智能 梦想。

据 Open人工智能 近期的一份报告称:“在最大规模的AI练习中用的计算量呈指数级增长,增加了 3.5 个月的时间”,这是自2012年以来的 30 万倍增长。

第二代项目专注于创建数据市场,比如 Ocean 协议、SingularityNet 或 Fysical,与群体数据标注平台,比如 Gems 或 Dbrain。

经济的 人工智能 规模化和积极的实验

第一代项目专注于创建连接和集成数据的数据基础设施,如 IOTA。IoT Chain、IoTex或 Streamr。

在这三种技术中,区块链技术是将各种技术组合在一块,并且还出现了一个由数据驱动的区块链项目组成的完整生态系统。这种分散的生态系统旨在鼓励大家贡献数据、技术资源和努力:

数据和算力如此珍贵,人工智能的未来在区块链上! 数据和算力如此珍贵,人工智能的未来在区块链上!
数据价值链

在我的职业生涯的开始,我过去是一名数据科学家,我早期的项目之一就是剖析阿尔茨海默病患者的原始人类基因数据。当时这个项目有很多事情令大家深感痛苦;大家不能不逐个招募参与者加入大家的项目,对基因组进行测序以获得数据,大家从研究经费中花费超越一百万。大家不能不自己搭建一个昂贵的计算集群,甚至连每次迭代的容易回归剖析也要耗费数天才能完成。我对这事印象特别深刻:花了几个礼拜的时间来设计大家的工程数据结构,优化数据库设置,手工重写剖析算法,先是为了剖析进行计算,然后需要几天完成而不是几个月。结果从那将来,发生了不少变化。

这种基于练习的办法的理论局限是,一个 DNN 构造如何在一个节点上练习、在多个不一样的服务器上应用,或分割成数个部分并分发到数个服务器上练习。显然,这种练习方法极其消耗算力,所以只能在强大的 GPU 和服务器上进行操作。Raven 解决这一问题的方法是装配动态节点分配机制,对互联网中的设施进行分工。如此,Raven 就可以消除主节点的所有依靠,并显著地降低任务所需的计算能力。

伴随解决方法涵盖了数据价值链成熟的第一步,我的朋友 @sherm8n 和 Rahul 开始研究 Raven 协议,这是第一个第三代项目,它将缩小在剖析阶段的一个要紧差距:用于AI练习的计算资源。

更高的市场准入壁垒,更难获得资金和资源。

对于深度学习研究者来讲,计算能力很重要,但 CPU 和 GPU 资源总是是有限的。Raven 协议正是解决这一问题的良方。Raven 协议可以借助空闲的计算资源来练习深度神经互联网,而这部分资源均来自个人用户设施的推荐。推荐空闲计算资源进行深度学习练习的定义可以为资源用户节省很多的研究本钱,而资源的贡献者则可以得到 Raven 币作为补偿 / 回报。

参考链接:
https://blog.goodaudience.com/the-future-of-ai-is-on-blockchain-1b4049ae2963
https://medium.com/ravenprotocol/hello-world-raven-protocol-f749bf5fc8cf

总之,这个区块链数据生态系统中的解决方法创造了新的机会并减少了本钱。特别是第二个重要原因,它减少了新革新的准入门槛,让更多的人可以做出贡献,从而有望加速大家整个社会的进步。

近年来,尽管AI和机器学习范围里关于民主化和去中心化的呼声愈加高,这部分范围中的项目开发却没真的地应用这部分定义。开发者和企业家们形成了一种思维定式,即只须很多用深度学习作为工具,就能改变商品水平和客户体验。然而,深度学习项目的经济规模化、商品化会遭到计算资源的限制。这部分限制对于大型科技公司当然不是问题。大公司有条件访问大量数据,而且坐拥庞大的计算资源,完全可以轻松应付计算密集型任务,从而推进我们的 人工智能 研发工作。同时,他们提出了 人工智能 的“民主化”定义,用以补偿他们所欠下的技术债务,并声称这会对广大 人工智能 社区有所帮。因此,人工智能 社区便拥有了访问大型 GPU 集群的权限,并有机会学习机器学习技术、用开源框架与观看 MOOC 在线课程。

为了保证平价医疗保险,大家的医疗系统需要很多的革新才能达成这一点,AI解决方法有不少可以帮达到这一目的。因此,医疗保健是AI资金投入最多的行业,多年来一直这样。

数据和算力如此珍贵,人工智能的未来在区块链上! 数据和算力如此珍贵,人工智能的未来在区块链上!
CBInsights:2018 年AI情况

假如上面所说的所有听上去有点抽象的话,那样你仅需看看AI可以发挥用途的范围就会了解了:医疗。大家的全球医疗体系正陷入紧急的困境。本钱正呈爆炸式增长,尽管本钱已经达到一个国家 GDP 的 18%,但预计将来十年将会增长 117%。与此同时,新药的研究也正面临风雨飘摇的处境。

现在,风头正劲的三种企业技术无疑是、和物联网,它们背后的驱动原因都是数据;大家甚至宣称:“数据就是新的石油!”新数据可以使数据的采集、共享、剖析与基于这部分数据的决策智能化成为可能,而这在以前基本上是一个数据价值链。

但,考虑到资源的增长率和AI工作的增长率都在成倍增加,即使是大型企业也会感到本钱增长带来的重压。在过去的几个月里,我与《财富》500 强企业的一些首席数据官促膝长谈,尽管他们觉得这一问题不足为虑,但也不能否认,可以用比购买 HPC 资源更好的方法进行资金投入。

更高的本钱,由于用的计算速度比提供更快;

Raven 可以成功地将模型练习过程中所需的数目庞大的小型异步运算,搭建为一个动态图。

然而,数据获得之难,本钱之高昂,带来了准入壁垒,限制了现有企业和其他大型企业对新解决方法的研究。区块链数据生态系统改变了这一情况,为大家带来了准时找到正确解决方法的机会。Raven 协议可能不会是最后一个如此的机会,但却是达成这一目的的要紧基石。

Raven 协议简介

目前深度学习存在的困境

对小型企业和研究职员来讲,这部分后果是可怕的,由于如此一来,限制了他们在没很多资金的状况下创建有竞争优势的模型的能力。即使有资金,假如提供商视他们为角逐对手,他们就大概被列入资源黑名单。

然而,这场技术狂欢之下隐藏的问题却鲜有人发现。对高级 人工智能 解决方法的忽然增长的需要使得这一问题凸显出来——计算能力的经济规模化。

期望进行技术改革的 人工智能 喜好者和企业家们目前可以从 人工智能 研究中有所收成了,由于众包资源可以解决计算资源短缺难点。人工智能 社区中的很多成员,如 Singularity.net、Ocean Protocol、OpenMind、Deep Brain Chain 等等,都打造起了资源共享平台,用于在安全的区块链内共享计算和数据资源,进而帮助机器学习 / 深度学习算法向商业模型的转变。

深度神经互联网的“去中心化、分布式”练习

Raven 协议允许个人用户贡献、推荐空闲设施的计算资源,使得研究者对性能强大的 CPU 或 GPU 硬件的需要降到最低。推荐空闲计算资源来进行练习的定义,会大大减少本钱。作为补偿 / 回报,计算资源的推荐者们会得到 Raven 币。
仅需在ETH区块链中通过智能合同进行两步容易的校验,这种勉励机制便可达成。

将来的趋势

空闲计算能力的勉励推荐机制