您当前的位置:首页 >> 机器人
机器人

吴恩达:AI是时候从大统计数据转向「小统计数据」了

发布时间:2025-09-03

拢优质数据库。有50个经过深思熟虑的举例来说就必无需向神经因特网解释你只想它学不会什么。

IEEE Spectrum:用50张图表基础训练一个仿真的原意是在一个用大数据库集基础训练好的现有仿真上对其顺利进行修改吗?还是说道这是一个全另行的模式,就从这个小数据库集上修习?

邵:我来讲一下Landing AI是来作什么的吧。在给制造厂商提供者阅未足测定服务建设项目时,我们一般就用类似于我们自己风格的RetinaNet。它是一个可不基础训练仿真。话说道出去,可不基础训练只是难题的一小部分,更是大的难题是提供者一个基本功能让制造厂商必无需可选择适当的图表集(常用修改),他用相符的形式对参考资料顺利进行上面。面对大数据库集的运用时,我们的一般来说自由基都是如果数据库有废气也就让,所有数据库照单全收,搜索算法不会对其顺利进行平均(average over)。但是,如果我们必无需联合开发显现出用来上面显现出数据库不相符的以前的基本功能,为制造厂商提供者一种十分有持续性的新方法来提极低数据库质量,那这将是拿到极低机动性控制系统的更是适当新方法。

就比如你那时候你有10000张图表,其里面30张属于一个类型,但这30张的标签不相符。我们要来作的一件有事就是借助于基本功能来带给你说明了这个特殊性的数据库集合,使你必无需快速再继续次对它们顺利进行上面,从而提极低仿真机动性。

IEEE Spectrum:像这样作常用极低质量的数据库集是否有助于抑制数据库种族歧视?

邵:十分有希望。有种族歧视的数据库是避免最终仿真产生种族歧视的众多因素之一。在NeurIPS不会议上,Mary Gray的演讲会讲到了以数据库为里面心的AI是这个疑问的极低效率之一(并非全部)。

以数据库为里面心的AI给我们造成的弱小技能之一是借助于(engineer)数据库集合。只想象一下,你基础训练了一个机器修习仿真,它的机动性对于大多数数据库集都还可以,但只有一个集合有差值。要是仅仅为了提极低该集合的机动性就改回整个神经因特网虚拟化,那是极为困难的。

但如果你能针对这个集合借助于(engineer)显现出合适的数据库,应付形式也就更是有持续性。

IEEE Spectrum:借助于(engineer)数据库的清楚原意是?

邵:在AI各个领域,数据库清洗很关键性,但目年前都是靠很机械设计的形式。面对一个十分大的数据库集时,这个基本功能可以快速地将你的注意力带给到有废气的数据库集合上,针对该集合顺利进行集里面校对。

就像我在此之年前断定口语鉴别控制系统的机动性很差,主要是故有事情节里面有汽车废气。并不知道了这一点,我就可以再继续校对更是多带这种废气故有事情节的数据库,而不是对所有概要都采取行动,简便又省时。

IEEE Spectrum:使用还原数据库怎么样?这也是个好的应付形式吗?

邵:还原数据库也是Data-centric AI基本功能集里面的一个关键性基本功能。在NeurIPS研讨不会上,Anima Anandkumar来作了一次就其还原数据库的惊艳演讲会。我显然它仅仅只是一个为仿真增加数据库的可不处理两步。我希望能说明了API将作常用还原数据库作为迭代机器修习仿真了控制系统的一部分。

IEEE Spectrum:你的原意是还原数据库可以让你在更是多各不相同数据库集上试图仿真吗?

邵:都是如此。论据你要测定智能左手机外壳上的瑕未足,还包括污渍、下巴、材料变白等。如果你的基础训练仿真在这个测定任务上总体展现出很差,但就是在鉴别下巴上展现出不佳,那么就可以用还原数据库作常用更是有持续性的数据库来补救。

IEEE Spectrum:能和我们详细说道一下当餐馆该公司发现Landing AI,比如要来作视觉效果检验,你们不会提供者何种希望?

邵:我们不会要求他们将数据库上传来我们的该平台,用意数据库为里面心的电脑新方法向他们提供者建议,并希望他们上面数据库。

Landing AI的着重是使用权制造厂商自己来作机器修习岗位,我们的很多岗位是尽可能软件快速且好上左手。在机器修习的迭代反复里面,我们不会为顾客提供者建议,比如如何在该平台上基础训练仿真,如何以及何时小型化数据库上面来提极低仿真机动性。

IEEE Spectrum:如果其产品或照明先决条件什么的转变,这种仿真能赶上吗?

邵:所以说道使用权产业顾客自己更是正数据库、再继续次基础训练和更是另行仿真十分关键性。

在消费互联网里面,我们只无需基础训练少数机器修习仿真就能服务建设项目10亿用户。在产业里面,有10000家制造厂商就要搭起10000个定制仿真。考验是,你如何来作到这点还不用雇佣10000名机器修习专家?

这个疑问在其他从业者比如诊疗健康各个领域也存在。

摆脱这一困境的唯一办法是联合开发显现出必无需让顾客自己设计数据库、表远超大学本科各个领域知识的基本功能,让他们自己借助于仿真。这也是Landing AI在计数机视觉效果各个领域里面正在来作的实是。

IEEE Spectrum:最后还有什么只想说道的?

邵:在只不过十年里面,电脑的仅有演变是向浅层修习的演变。我显然在这十年里面,仅有的演变很似乎是靠拢以数据库为里面心的电脑。随着当今神经因特网虚拟化的成熟期,我显然对于许多实际运用而言,瓶颈将是我们能否适当地获取让仿真运营很差所无需的数据库。

而以数据库为里面心的电脑爱国运动在整个乡村享有年前所未见的电磁场和涡轮。我希望更是多的研究成果人员和API必无需转至并致力于它。

下回。

报道书名:

>— 下回 —

量子力学位 QbitAI · 头条号解约

注意我们,第一时间获知第一线科技动态

常德看不孕不育哪家医院专业
贵阳癫痫医院哪家最好
北京治疗白癜风哪好

上一篇: 最无法忍受单身的吉日(图)

下一篇: 狗狗排便前所转圈这个“谜”,养狗多年的你,未必能解开

友情链接