人+工念什么人工念什么姓-腾众软件科技有限公司

人+工念什么人工念什么姓 ChatGPT之后又一应用杀疯了，AIGC或进入可控期，将洗牌科技行业？

自聊天机器人ChatGPT火(huǒ)爆(bào)以来(lái)，微软公(gōng)司(sī)创始人比尔·盖(gài)茨已多次公开谈论人工(gōng)智能话题。在最近(jìn)的一次(cì)采(cǎi)访中，他(tā)再次表示：“AI可能(néng)会让科技(jì)行(xíng)业迎来一次剧烈的洗牌(pái)”。

这个结论是他在(zài)当地时间2月20日接受(shòu)《In Good Company》节(jié)目专访时(shí)提(tí)出的。

他预期，AI的发展可(kě)能会威(wēi)胁到谷歌(gē)的市(shì)占率，因(yīn)为微软(ruǎn)在AI方面的行动相当迅速(s人+工念什么人工念什么姓ù)。而最终科技巨头将(jiāng)把AI整(zhěng)合成用户(hù)的“全能助手”，包揽一切应用，与人们进行沟通并提供建议，可(kě)以取(qǔ)代亚马(mǎ)逊(xùn)、Siri或(huò)Outlook等应用。

大(dà)佬口中全能助(zhù)手的到来可能尚需时日，但由ControlNet引发的(de)又一次AI绘画浪潮，让AIGC在ChatGPT的话题(tí)热点包围中杀(shā)出(chū)重(zhòng)围。

ChatGPT之后又一应(yīng)用杀疯了，AIGC或进入可控期，将(jiāng)洗牌科(kē)技行(xíng)业(yè)？_黑料正能量

ControlNet颠覆(fù)AI绘画新玩法

AIGC向可(kě)控(kòng)靠近(jìn)

以AI绘画为代表(biǎo)的AIGC上一(yī)次爆(bào)火的时候(hòu)，还是2022年8月，在美国科罗拉多(duō)州举办(bàn)的新兴数字艺术(shù)家竞赛中，一幅名(míng)为(wèi)《太空歌剧院》的(de)作品获奖。

随后各大厂商的AI绘画软件被广大网友熟(shú)知并(bìng)体(tǐ)验(yàn)，Stable Diffusion便是其中代表。

用(yòng)户们可以在应用中输入一(yī)组关(guān)键词或者(zhě)一张照片，就能获(huò)得一幅AI创作的画作(zuò)。

作画(huà)的关(guān)键(jiàn)就是所输入的文本。同(tóng)一组(zǔ)关键(jiàn)词(cí)也(yě)可以创(chuàng)作出很多张风格(gé)不一样的(de)画作(zuò)，这让(ràng)创作的过程(chéng)就像开盲(máng)盒(hé)。

很多(duō)用户很喜欢(huān)这种不确定的(de)惊(jīng)喜，他(tā)们(men)会将生成的(de)美图当做头像。而(ér)另(lìng)一部分喜欢翻看(kàn)AI绘画的“翻车(chē)”作品(pǐn)。在社交媒体上，许多用户分享AI“翻车现(xiàn)场”，例(lì)如，一位网友的小(xiǎo)狗照片被AI画成(chéng)了(le)“肌(jī)肉男”，还有网友的个人照片(piàn)被AI识(shí)别成了建筑。

而(ér)如今(jīn)随着ControlNet的出现与(yǔ)加持，以往AI绘画的填(tián)写(xiě)关(guān)键词(cí)游戏(xì)可能要被颠覆了。

ControlNet是一位正在斯坦福读(dú)博的中国人(rén)张(zhāng)吕敏创作的一种(zhǒng)基于控制点(diǎn)的图像变形算法，主要用(yòng)于(yú)数字(zì)图像处理、计算机视觉和计算机(jī)图形学(xué)等领(lǐng)域(yù)。

其(qí)SD插件一经发(fā)布(bù)，在短短的两(liǎng)天内便成为了AI绘画领域(yù)最新的热(rè)点。

在此之前，大家用了很(hěn)多方法(fǎ)想让AI生成的结果尽可(kě)能的(de)符合要求，但是都不尽如人意，它的出(chū)现代表着AI生成开始进入真正的(de)可控(kòng)时期。

因为(wèi)ControlNet可(kě)以直接(jiē)提取(qǔ)画面的构图，人物的姿势和画面的深度信息等。有了它的帮助，就不用频繁的用提(tí)示词(cí)来碰(pèng)运气，抽盲盒式的(de)创作了(le)。

通俗(sú)的说ControlNet相当(dāng)于给AI绘画(huà)加了“魔法”，不少博主的作品已经获得了大(dà)量的(de)浏览量，“viggo”就是(shì)其中之一(yī)，他用(yòng)朋友(yǒu)的照片直接带(dài)她们走进动漫世(shì)界。

viggo先用StableDiffusion图片转文字(zì)。

再用Text2Prompt插件拓展找到(dào)对应的关键(jiàn)词；最后用ControlNet插件绑定骨(gǔ)骼开(kāi)始(shǐ)换关键词试效果。

通过图片就可(kě)以看出(chū)来，效(xiào)果十分惊艳(yàn)。

更厉害的(de)是，除了真实的照片(piàn)，草图也可(kě)以加上“魔法”，知乎大牛“DevPoint”和“逗(dòu)砂”介绍到(dào)ControlNet还能(néng)实现(xiàn)线(xiàn)稿(gǎo)转全彩图。大神张吕敏其本尊(zūn)也亲自回应。

不得不说当下AIGC已经变得越(yuè)来越强大，甚至输出的作(zuò)品(pǐn)都(dōu)已经能(néng)以假(jiǎ)乱真(zhēn)了。

难(nán)辨虚实，AIGC技术力爆发

警惕安全问题

近日，“苏州金鸡湖有游(yóu)艇party”的消息火遍网(wǎng)络，而经过警方辟谣这所谓的“party”可能是全国(guó)第一(yī)起AI绘图诈骗。

由于这人+工念什么人工念什么姓个活动里面给出的(de)美女照片都是AI制作的(de)真人照片(piàn)绘图，因(yīn)为太(tài)逼(bī)真，被大家当(dāng)成真事传播(bō)了。

不过仔细观察可以发现(xiàn)，活动发起(qǐ)者提供的照(zhào)片中有个(gè)很大的漏洞可以发(fā)现并(bìng)非真人，而是(shì)AI绘图，那便(biàn)是图片中女(nǚ)性的手(shǒu)指部(bù)分有的存在异常。

ChatGPT之后(hòu)又一应用杀疯了(le)，AIGC或进入可控期(qī)，将洗牌科技行(xíng)业？_黑料(liào)正能量

有(yǒu)行(xíng)业(yè)人事表示：“现在(zài)因为手指部分的绘画算法(fǎ)比较(jiào)复杂，AI还不太(tài)会画人的手(shǒu)，但最新看到的图片已经有(yǒu)越来(lái)越完(wán)美的AI模型(xíng)出(chū)现，以(yǐ)后(hòu)可能就完全(quán)没有漏洞(dòng)了。”

类似的AI作图诈骗在国外(wài)也已有发生。据英(yīng)国广播公司报道，土(tǔ)耳其地震期间，有Tiktok用户使用AI合成了儿(ér)童(tóng)受(shòu)灾的(de)假照片发布(bù)到网络，以(yǐ)此(cǐ)诱(yòu)骗善良(liáng)的人打赏(shǎng)“捐助(zhù)”从(cóng)而实施诈骗。

目前随着技术发展，AIGC已经能(néng)做出(chū)真(zhēn)人照片般的绘图效(xiào)果，如果这(zhè)样的图(tú)片(piàn)被用来诈骗，将非常可怕。

此(cǐ)外AIGC还引发了(le)很多担(dān)忧(yōu)，一方面，批判者(zhě)认为AI在“学习”了大量前(qián)人的作品(pǐn)之后，其创作没有(yǒu)任何(hé)情绪和灵(líng)魂，难(nán)以和人类的(de)艺术创作相提并论。

另一方(fāng)面，AIGC背后的版权(quán)、目前都并(bìng)没有得(dé)到有效的解决，还有AIGC会不会代替人(rén)类“至(zhì)高(gāo)无(wú)上”的创意。

马斯克也强调，人(rén)工智能的(de)安全问题需要得到(dào)重视(shì)，太晚就来不(bù)及了。

AIGC下一站除了视频，还有远方

技术都是有两面性的(de)，潜在(zài)的危(wēi)害并(bìng)不能掩盖其光辉的(de)贡献。现(xiàn)在(zài)看(kàn)来(lái)，人(rén)工智能技术(shù)将是第四次工(gōng)业革命的核心(xīn)驱动(dòng)力量，将创(chuàng)造新(xīn)的增长奇迹(jì)。

过去一年，人工智能在(zài)技(jì)术和(hé)商业层面都有了巨(jù)大进展，AI绘画就是人工智能技术发生(shēng)方向性(xìng)改变的一个(gè)代(dài)表。其下一站或许就是(shì)视频。

此前，Meta和谷歌先(xiān)后发布了几条(tiáo)引爆科技圈的短视频(pín)。这些(xiē)视频(pín)引发关注并非(fēi)内容做(zuò)得多优秀，反而都(dōu)非常(cháng)简单，比(bǐ)如一匹正(zhèng)在(zài)喝水的马，一只画画的玩(wán)具熊，或者一段骑摩(mó)托(tuō)车的第一视角录像，随便(biàn)一个(gè)有手机的人都可以随手录下一段。

但这些(xiē)短视频的创作(zuò)方式(shì)非常简单，创作(zuò)者仅仅需要向AI输入一段话，甚(shèn)至只是说(shuō)一下要求，AI就可以根(gēn)据需要生成(chéng)一段视频(pín)。

谷歌发(fā)布的两(liǎng)个AI生成视频(pín)分(fēn)别(bié)来(lái)自于Imagen Video和Phenaki，前者主要突出的是(shì)高清，与Meta的Make-A-Video没(méi)有太多(duō)的差别(bié)。

在Make-A-Video公布了AI生成(chéng)的视频后，AI圈就已(yǐ)经玩了一人+工念什么人工念什么姓波梗，一个能够做出更高清视频(pín)的AI还不足以在短时间内戳中兴奋点。

Phenaki更加令人震惊的地方在于，它可以制(zhì)作出超过2分钟的连贯的(de)也有确切内(nèi)容的视频，这(zhè)才是真正让(ràng)人们感到惊喜的地方。因为无(wú)论AI生成(chéng)的视频多么高清，也只能是(shì)为内容生产者提(tí)供一(yī)个灵感，一个素(sù)材，一个过场动(dòng)画。

不过能够制作出有(yǒu)具体剧情内容(róng)的视频就意味着，一些视频创作由AI代替人工完成已经(jīng)初(chū)步有了可(kě)能。

当下AI的发展速度(dù)已经超过(guò)大部分人(rén)的想象。内(nèi)容(róng)产业的本(běn)质是(shì)供(gōng)给创(chuàng)造(zào)需求，AIGC作为全(quán)新的内容生产(chǎn)方式，可以为内容产业带来更新的(de)内容风格、更(gèng)快(kuài)的生产速(sù)度，更(gèng)低(dī)的生(shēng)产成本(běn)，这无疑会驱动内容产业的大爆发。

除了AI绘(huì)图、视频，AIGC技术还(hái)能应用于音(yīn)乐(lè)、代码、机(jī)器人(rén)动(dòng)作等多种(zhǒng)内(nèi)容形式的生成。不难发(fā)现该项(xiàng)技(jì)术不仅在游戏(xì)等行业能得到有效应用(yòng)，对于下一代互联网(wǎng)各种元素(sù)的构(gòu)建(jiàn)亦(yì)有关键意义。

从(cóng)商业化(huà)的角度来看，文化(huà)娱乐、教育、传媒(méi)等诸(zhū)多(duō)领域(yù)，本身就对基于AI的可视(shì)化(huà)内容有强烈需求。

因(yīn)此，AI绘画及视频或不是结果，而只(zhǐ)是AI进(jìn)程(chéng)中的一(yī)块重要(yào)拼图，有望在技(jì)术更(gèng)新的加持(chí)下实现更大的应用(yòng)价值。

AI从理解内(nèi)容，走向了可以生成(chéng)内容，甚至能(néng)够(gòu)创(chuàng)造出独立价值和独(dú)立(lì)视角的(de)内容。AIGC的(de)再次出圈，更(gèng)代表(biǎo)着(zhe)未来的(de)先进(jìn)生产力即将到来(lái)。

紧抓大(dà)模型(xíng)与算(suàn)力，牢固AIGC底(dǐ)座

从(cóng)技术的发(fā)展也可(kě)以(yǐ)看(kàn)出，在(zài)语言大模(mó)型、图像大(dà)模(mó)型(xíng)之后，多模态大模型已经成(chéng)为(wèi)了新的趋势。

大模型被誉为当(dāng)前人工智能发展(zhǎn)的(de)智能底座，是全球竞争最激烈的研究方(fāng)向(xiàng)之一，包括谷歌、亚(yà)马逊、百度、阿(ā)里(lǐ)、腾讯(xùn)等众多头部企业都在竞相发力(lì)。

不(bù)过训练大模(mó)型的(de)确价格(gé)不菲，以国盛证(zhèng)券发布的《ChatGPT需要多少算力》报(bào)告估算，GPT-3训(xùn)练一(yī)次的成(chéng)本约(yuē)为140万(wàn)美元。而对于一些(xiē)更大的LLM(大型语(yǔ)言(yán)模型)，训(xùn)练成本则介(jiè)于200万美(měi)元至1200万美元(yuán)高(gāo)价(jià)之间。

以(yǐ)ChatGPT在2023年1月的独立访客平均(jūn)数1300万(wàn)计算，其对应(yīng)芯片需求为3万多(duō)片英伟达A100 GPU，初(chū)始投入成本(běn)约为8亿美元，每(měi)日仅(jǐn)电费就在5万美元左(zuǒ)右(yòu)。

此外不论(lùn)是ChatGPT还是(shì)AIGC，都离不开庞大算力(lì)支持。在关注各类大模型的发展(zhǎn)同时，更(gèng)应该关注算力网(wǎng)络(luò)的(de)建设(shè)。

算力(lì)网络正驱动(dòng)AI产业发展进(jìn)入史诗(shī)级加速(sù)进程(chéng)，让(ràng)AIGC及通用AI这(zhè)一(yī)人工智能发展的终极目标(biāo)离(lí)得更近。

因为(wèi)算力可(kě)以对突破性技术创新提(tí)供大力(lì)的支持(chí)。这方(fāng)面，多(duō)模态大模(mó)型是(shì)典(diǎn)型。作(zuò)为(wèi)面向未(wèi)来强(qiáng)人工智能(néng)、通用(yòng)人(rén)工智(zhì)能的重要技(jì)术创新，多模态大(dà)模型已经在人工智能领域提出(chū)了很多年，业界也有不少技术突破，但是，多模态大(dà)模型(xíng)进一步往(wǎng)下(xià)走，算(suàn)力需求呈(chéng)几(jǐ)何(hé)式上升，一般的算力基(jī)础设施很快将难以(yǐ)胜任。

从图像、文字、语音单(dān)独一项(xiàng)的训练，到双模态、三(sān)模(mó)态的跃迁，让人工智能可以(yǐ)灵活应对不同模态的(de)转化、像人与(yǔ)世界交互一样(yàng)自然，这方面(miàn)，由算力(lì)网络来驱动将有明(míng)显优势。