腾众软件科技有限公司腾众软件科技有限公司

人+工念什么 人工念什么姓

人+工念什么 人工念什么姓 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火(huǒ)爆(bào)以来(lái),微软公(gōng)司(sī)创始人比尔·盖(gài)茨已多次公开谈论人工(gōng)智能话题。在最近(jìn)的一次(cì)采(cǎi)访中,他(tā)再次表示:“AI可能(néng)会让科技(jì)行(xíng)业迎来一次剧烈的洗牌(pái)”。

这个结论是他在(zài)当地时间2月20日接受(shòu)《In Good Company》节(jié)目专访时(shí)提(tí)出的。

他预期,AI的发展可(kě)能会威(wēi)胁到谷歌(gē)的市(shì)占率,因(yīn)为微软(ruǎn)在AI方面的行动相当迅速(s人+工念什么 人工念什么姓ù)。而最终科技巨头将(jiāng)把AI整(zhěng)合成用户(hù)的“全能助手”,包揽一切应用,与人们进行沟通并提供建议,可(kě)以取(qǔ)代亚马(mǎ)逊(xùn)、Siri或(huò)Outlook等应用。

大(dà)佬口中全能助(zhù)手的到来可能尚需时日,但由ControlNet引发的(de)又一次AI绘画浪潮,让AIGC在ChatGPT的话题(tí)热点包围中杀(shā)出(chū)重(zhòng)围。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进入可控期,将(jiāng)洗牌科(kē)技行(xíng)业(yè)?_黑料正能量

01

ControlNet颠覆(fù)AI绘画新玩法

AIGC向可(kě)控(kòng)靠近(jìn)

以AI绘画为代表(biǎo)的AIGC上一(yī)次爆(bào)火的时候(hòu),还是2022年8月,在美国科罗拉多(duō)州举办(bàn)的新兴数字艺术(shù)家竞赛中,一幅名(míng)为(wèi)《太空歌剧院》的(de)作品获奖。

随后各大厂商的AI绘画软件被广大网友熟(shú)知并(bìng)体(tǐ)验(yàn),Stable Diffusion便是其中代表。

ChatGPT之(zhī)后又一(yī)应(yīng)用杀疯(fēng)了,AIGC或进入可控期,将(jiāng)洗牌(pái)科技行(xíng)业(yè)?_黑料正能(néng)量

用(yòng)户们可以在应用中输入一(yī)组关(guān)键词或者(zhě)一张照片,就能获(huò)得一幅AI创作的画作(zuò)。

作画(huà)的关(guān)键(jiàn)就是所输入的文本。同(tóng)一组(zǔ)关键(jiàn)词(cí)也(yě)可以创(chuàng)作出很多张风格(gé)不一样的(de)画作(zuò),这让(ràng)创作的过程(chéng)就像开盲(máng)盒(hé)。

很多(duō)用户很喜欢(huān)这种不确定的(de)惊(jīng)喜,他(tā)们(men)会将生成的(de)美图当做头像。而(ér)另(lìng)一部分喜欢翻看(kàn)AI绘画的“翻车(chē)”作品(pǐn)。在社交媒体上,许多用户分享AI“翻车现(xiàn)场”,例(lì)如,一位网友的小(xiǎo)狗照片被AI画成(chéng)了(le)“肌(jī)肉男”,还有网友的个人照片(piàn)被AI识(shí)别成了建筑。

而(ér)如今(jīn)随着ControlNet的出现与(yǔ)加持,以往AI绘画的填(tián)写(xiě)关(guān)键词(cí)游戏(xì)可能要被颠覆了。

ChatGPT之(zhī)后又一(yī)应用杀疯(fēng)了(le),AIGC或(huò)进(jìn)入(rù)可控期,将洗(xǐ)牌科技(jì)行业?_黑料(liào)正能量

ControlNet是一位正在斯坦福读(dú)博的中国人(rén)张(zhāng)吕敏创作的一种(zhǒng)基于控制点(diǎn)的图像变形算法,主要用(yòng)于(yú)数字(zì)图像处理、计算机视觉和计算机(jī)图形学(xué)等领(lǐng)域(yù)。

其(qí)SD插件一经发(fā)布(bù),在短短的两(liǎng)天内便成为了AI绘画领域(yù)最新的热(rè)点。

在此之前,大家用了很(hěn)多方法(fǎ)想让AI生成的结果尽可(kě)能的(de)符合要求,但是都不尽如人意,它的出(chū)现代表着AI生成开始进入真正的(de)可控(kòng)时期。

因为(wèi)ControlNet可(kě)以直接(jiē)提取(qǔ)画面的构图,人物的姿势和画面的深度信息等。有了它的帮助,就不用频繁的用提(tí)示词(cí)来碰(pèng)运气,抽盲盒式的(de)创作了(le)。

通俗(sú)的说ControlNet相当(dāng)于给AI绘画(huà)加了“魔法”,不少博主的作品已经获得了大(dà)量的(de)浏览量,“viggo”就是(shì)其中之一(yī),他用(yòng)朋友(yǒu)的照片直接带(dài)她们走进动漫世(shì)界。

ChatGPT之(zhī)后又一应用(yòng)杀疯了,AIGC或进(jìn)入(rù)可(kě)控期,将洗牌(pái)科技行(xíng)业?_黑(hēi)料正能(néng)量(liàng)

viggo先用StableDiffusion图片转文字(zì)。

再用Text2Prompt插件拓展找到(dào)对应的关键(jiàn)词;最后用ControlNet插件绑定骨(gǔ)骼开(kāi)始(shǐ)换关键词试效果。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控(kòng)期(qī),将洗牌(pái)科技行业?_黑料正能量

通过图片就可(kě)以看出(chū)来,效(xiào)果十分惊艳(yàn)。

ChatGPT之后(hòu)又一应用杀疯了(le),AIGC或进入可控(kòng)期,将(jiāng)洗牌(pái)科技行(xíng)业?_黑(hēi)料正(zhèng)能(néng)量

ChatGPT之后又一(yī)应用(yòng)杀(shā)疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑料(liào)正能(néng)量

更厉害的(de)是,除了真实的照片(piàn),草图也可(kě)以加上“魔法”,知乎大牛“DevPoint”和“逗(dòu)砂”介绍到(dào)ControlNet还能(néng)实现(xiàn)线(xiàn)稿(gǎo)转全彩图。大神张吕敏其本尊(zūn)也亲自回应。

ChatGPT之(zhī)后又一应用杀疯了,AIGC或进入可(kě)控期,将(jiāng)洗牌科技行业(yè)?_黑料正能量(liàng)

不得不说当下AIGC已经变得越(yuè)来越强大,甚至输出的作(zuò)品(pǐn)都(dōu)已经能(néng)以假(jiǎ)乱真(zhēn)了。

02

难(nán)辨虚实,AIGC技术力爆发

警惕安全问题

近日,“苏州金鸡湖有游(yóu)艇party”的消息火遍网(wǎng)络,而经过警方辟谣这所谓的“party”可能是全国(guó)第一(yī)起AI绘图诈骗。

由于这人+工念什么 人工念什么姓个活动里面给出的(de)美女照片都是AI制作的(de)真人照片(piàn)绘图,因(yīn)为太(tài)逼(bī)真,被大家当(dāng)成真事传播(bō)了

ChatGPT之后又(yòu)一(yī)应用(yòng)杀(shā)疯(fēng)了,AIGC或进(jìn)入可控期,将洗牌科技行业(yè)?_黑料(liào)正(zhèng)能(néng)量

不过仔细观察可以发现(xiàn),活动发起(qǐ)者提供的照(zhào)片中有个(gè)很大的漏洞可以发(fā)现并(bìng)非真人,而是(shì)AI绘图,那便(biàn)是图片中女(nǚ)性的手(shǒu)指部(bù)分有的存在异常。

ChatGPT之后(hòu)又一应用杀疯了(le),AIGC或进入可控期(qī),将洗牌科技行(xíng)业?_黑料(liào)正能量

有(yǒu)行(xíng)业(yè)人事表示:“现在(zài)因为手指部分的绘画算法(fǎ)比较(jiào)复杂,AI还不太(tài)会画人的手(shǒu),但最新看到的图片已经有(yǒu)越来(lái)越完(wán)美的AI模型(xíng)出(chū)现,以(yǐ)后(hòu)可能就完全(quán)没有漏洞(dòng)了。

类似的AI作图诈骗在国外(wài)也已有发生。据英(yīng)国广播公司报道,土(tǔ)耳其地震期间,有Tiktok用户使用AI合成了儿(ér)童(tóng)受(shòu)灾的(de)假照片发布(bù)到网络,以(yǐ)此(cǐ)诱(yòu)骗善良(liáng)的人打赏(shǎng)“捐助(zhù)”从(cóng)而实施诈骗。

目前随着技术发展,AIGC已经能(néng)做出(chū)真(zhēn)人照片般的绘图效(xiào)果,如果这(zhè)样的图(tú)片(piàn)被用来诈骗,将非常可怕。

此(cǐ)外AIGC还引发了(le)很多担(dān)忧(yōu),一方面,批判者(zhě)认为AI在“学习”了大量前(qián)人的作品(pǐn)之后,其创作没有(yǒu)任何(hé)情绪和灵(líng)魂,难(nán)以和人类的(de)艺术创作相提并论。

另一方(fāng)面,AIGC背后的版权(quán)、目前都并(bìng)没有得(dé)到有效的解决,还有AIGC会不会代替人(rén)类“至(zhì)高(gāo)无(wú)上”的创意。

马斯克也强调,人(rén)工智能的(de)安全问题需要得到(dào)重视(shì),太晚就来不(bù)及了。

03

AIGC下一站除了视频,还有远方

技术都是有两面性的(de),潜在(zài)的危(wēi)害并(bìng)不能掩盖其光辉的(de)贡献。现(xiàn)在(zài)看(kàn)来(lái),人(rén)工智能技术(shù)将是第四次工(gōng)业革命的核心(xīn)驱动(dòng)力量,将创(chuàng)造新(xīn)的增长奇迹(jì)。

过去一年,人工智能在(zài)技(jì)术和(hé)商业层面都有了巨(jù)大进展,AI绘画就是人工智能技术发生(shēng)方向性(xìng)改变的一个(gè)代(dài)表。其下一站或许就是(shì)视频。

此前,Meta和谷歌先(xiān)后发布了几条(tiáo)引爆科技圈的短视频(pín)。这些(xiē)视频(pín)引发关注并非(fēi)内容做(zuò)得多优秀,反而都(dōu)非常(cháng)简单,比(bǐ)如一匹正(zhèng)在(zài)喝水的马,一只画画的玩(wán)具熊,或者一段骑摩(mó)托(tuō)车的第一视角录像,随便(biàn)一个(gè)有手机的人都可以随手录下一段。

ChatGPT之后又一应用杀疯了,AIGC或进入可控(kòng)期,将洗牌科技行业?_黑料正能量(liàng)

但这些(xiē)短视频的创作(zuò)方式(shì)非常简单,创作(zuò)者仅仅需要向AI输入一段话,甚(shèn)至只是说(shuō)一下要求,AI就可以根(gēn)据需要生成(chéng)一段视频(pín)。

谷歌发(fā)布的两(liǎng)个AI生成视频(pín)分(fēn)别(bié)来(lái)自于Imagen Video和Phenaki,前者主要突出的是(shì)高清,与Meta的Make-A-Video没(méi)有太多(duō)的差别(bié)。

在Make-A-Video公布了AI生成(chéng)的视频后,AI圈就已(yǐ)经玩了一人+工念什么 人工念什么姓波梗,一个能够做出更高清视频(pín)的AI还不足以在短时间内戳中兴奋点。

Phenaki更加令人震惊的地方在于,它可以制(zhì)作出超过2分钟的连贯的(de)也有确切内(nèi)容的视频,这(zhè)才是真正让(ràng)人们感到惊喜的地方。因为无(wú)论AI生成(chéng)的视频多么高清,也只能是(shì)为内容生产者提(tí)供一(yī)个灵感,一个素(sù)材,一个过场动(dòng)画。

不过能够制作出有(yǒu)具体剧情内容(róng)的视频就意味着,一些视频创作由AI代替人工完成已经(jīng)初(chū)步有了可(kě)能。

当下AI的发展速度(dù)已经超过(guò)大部分人(rén)的想象。内(nèi)容(róng)产业的本(běn)质是(shì)供(gōng)给创(chuàng)造(zào)需求,AIGC作为全(quán)新的内容生产(chǎn)方式,可以为内容产业带来更新的(de)内容风格、更(gèng)快(kuài)的生产速(sù)度,更(gèng)低(dī)的生(shēng)产成本(běn),这无疑会驱动内容产业的大爆发。

除了AI绘(huì)图、视频,AIGC技术还(hái)能应用于音(yīn)乐(lè)、代码、机(jī)器人(rén)动(dòng)作等多种(zhǒng)内(nèi)容形式的生成。不难发(fā)现该项(xiàng)技(jì)术不仅在游戏(xì)等行业能得到有效应用(yòng),对于下一代互联网(wǎng)各种元素(sù)的构(gòu)建(jiàn)亦(yì)有关键意义。

从(cóng)商业化(huà)的角度来看,文化(huà)娱乐、教育、传媒(méi)等诸(zhū)多(duō)领域(yù),本身就对基于AI的可视(shì)化(huà)内容有强烈需求。

因(yīn)此,AI绘画及视频或不是结果,而只(zhǐ)是AI进(jìn)程(chéng)中的一(yī)块重要(yào)拼图,有望在技(jì)术更(gèng)新的加持(chí)下实现更大的应用(yòng)价值。

AI从理解内(nèi)容,走向了可以生成(chéng)内容,甚至能(néng)够(gòu)创(chuàng)造出独立价值和独(dú)立(lì)视角的(de)内容。AIGC的(de)再次出圈,更(gèng)代表(biǎo)着(zhe)未来的(de)先进(jìn)生产力即将到来(lái)。

ChatGPT之后又一应用杀(shā)疯了(le),AIGC或进入(rù)可(kě)控期(qī),将洗牌科技行业?_黑(hēi)料正能量(liàng)

04

紧抓大(dà)模型(xíng)与算(suàn)力,牢固AIGC底(dǐ)座

从(cóng)技术的发(fā)展也可(kě)以(yǐ)看(kàn)出,在(zài)语言大模(mó)型、图像大(dà)模(mó)型(xíng)之后,多模态大模型已经成(chéng)为(wèi)了新的趋势。

大模型被誉为当(dāng)前人工智能发展(zhǎn)的(de)智能底座,是全球竞争最激烈的研究方(fāng)向(xiàng)之一,包括谷歌、亚(yà)马逊、百度、阿(ā)里(lǐ)、腾讯(xùn)等众多头部企业都在竞相发力(lì)。

不(bù)过训练大模(mó)型的(de)确价格(gé)不菲,以国盛证(zhèng)券发布的《ChatGPT需要多少算力》报(bào)告估算,GPT-3训(xùn)练一(yī)次的成(chéng)本约(yuē)为140万(wàn)美元。而对于一些(xiē)更大的LLM(大型语(yǔ)言(yán)模型),训(xùn)练成本则介(jiè)于200万美(měi)元至1200万美元(yuán)高(gāo)价(jià)之间。

以(yǐ)ChatGPT在2023年1月的独立访客平均(jūn)数1300万(wàn)计算,其对应(yīng)芯片需求为3万多(duō)片英伟达A100 GPU,初(chū)始投入成本(běn)约为8亿美元,每(měi)日仅(jǐn)电费就在5万美元左(zuǒ)右(yòu)。

ChatGPT之后(hòu)又一应(yīng)用杀疯了,AIGC或进入(rù)可控期,将洗牌科技(jì)行业(yè)?_黑(hēi)料正能量

此外不论(lùn)是ChatGPT还是(shì)AIGC,都离不开庞大算力(lì)支持。在关注各类大模型的发展(zhǎn)同时,更(gèng)应该关注算力网(wǎng)络(luò)的(de)建设(shè)。

算力(lì)网络正驱动(dòng)AI产业发展进(jìn)入史诗(shī)级加速(sù)进程(chéng),让(ràng)AIGC及通用AI这(zhè)一(yī)人工智能发展的终极目标(biāo)离(lí)得更近。

因为(wèi)算力可(kě)以对突破性技术创新提(tí)供大力(lì)的支持(chí)。这方(fāng)面,多(duō)模态大模(mó)型是(shì)典(diǎn)型。作(zuò)为(wèi)面向未(wèi)来强(qiáng)人工智能(néng)、通用(yòng)人(rén)工智(zhì)能的重要技(jì)术创新,多模态大(dà)模型已经在人工智能领域提出(chū)了很多年,业界也有不少技术突破,但是,多模态大(dà)模型(xíng)进一步往(wǎng)下(xià)走,算(suàn)力需求呈(chéng)几(jǐ)何(hé)式上升,一般的算力基(jī)础设施很快将难以(yǐ)胜任。

从图像、文字、语音单(dān)独一项(xiàng)的训练,到双模态、三(sān)模(mó)态的跃迁,让人工智能可以(yǐ)灵活应对不同模态的(de)转化、像人与(yǔ)世界交互一样(yàng)自然,这方面(miàn),由算力(lì)网络来驱动将有明(míng)显优势。

ChatGPT之后又一应用杀(shā)疯了,AIGC或进(jìn)入可控(kòng)期,将(jiāng)洗牌科技(jì)行业?_黑料正能量(liàng)

此(cǐ)外,还(hái)有很多需要爆发式(shì)增(zēng)长的(de)算力来(lái)支撑的技术创新,将在人工智能算(suàn)力网络支(zhī)撑下(xià)快速推进。

AIGC已经露(lù)出曙光,期待在(zài)大(dà)模型(xíng)和(hé)大算力的支持下AIGC能持续颠覆内容生(shēng)产的方式,将(jiāng)创(chuàng)造的边际成(chéng)本降低(dī),让万(wàn)众受益。

未经允许不得转载:腾众软件科技有限公司 人+工念什么 人工念什么姓

评论

5+2=