腾众软件科技有限公司腾众软件科技有限公司

古诗山衔落日浸寒漪,山衔落日浸寒漪的诗意是什么

古诗山衔落日浸寒漪,山衔落日浸寒漪的诗意是什么 ChatGPT之后又一应用杀疯了,AIGC或进入可控期,将洗牌科技行业?

自聊天机器人ChatGPT火爆以来,微(wēi)软(ruǎn)公司创始人比尔·盖(gài)茨已多次公(gōng)开谈论人工智能话题(tí)。在(zài)最(zuì)近的一(yī)次采访中,他再次表(biǎo)示:“AI可能会让(ràng)科技行业迎来(lái)一次剧(jù)烈的洗牌”。

这(zhè)个(gè)结论是他在当地时(shí)间2月(yuè)20日接受《In Good Company》节目专访时提出的。

他预(yù)期(qī),AI的发展可能(néng)会威胁到谷歌的市占(zhàn)率,因为微软(ruǎn)在AI方(fāng)面的行动相当迅速。而最终科(kē)技(jì)巨头将把AI整合成(chéng)用户的“全(quán)能助手”,包揽一切应用,与人们进行沟(gōu)通并提供建(jiàn)议(yì),可以取代(dài)亚马(mǎ)逊、Siri或Outlook等(děng)应用。

大佬口中(zhōng)全(quán)能助手的到来(lái)可能尚需时(shí)日,但由(yóu)ControlNet引发的又一次AI绘画浪(làng)潮,让AIGC在ChatGPT的话题(tí)热(rè)点包围中杀出重围。

ChatGPT之(zhī)后又一应用(yòng)杀疯了(le),AIGC或进入可控期,将洗牌科技行(xíng)业?_黑料正能量

01

ControlNet颠覆AI绘画新(xīn)玩法

AIGC向(xiàng)可控靠近

以AI绘画为代表的(de)AIGC上一次爆火的时(shí)候,还是2022年8月(yuè),在美国科(kē)罗拉多州(zhōu)举办的新兴数字艺术家竞赛中(zhōng),一幅名(míng)为《太(tài)空歌剧院》的作品获奖。

随后各大厂商的(de)AI绘画软件(jiàn)被广大(dà)网友熟(shú)知并体验,Stable Diffusion便是其中(zhōng)代表。

ChatGPT之(zhī)后又一(yī)应用杀疯了,AIGC或进入可控期,将洗(xǐ)牌(pái)科技(jì)行业?_黑料正能量

用户们可以(yǐ)在应用中输入一组关键词或者一张照片,就(jiù)能获得一(yī)幅AI创(chuàng)作的(de)画作。

作(zuò)画的关键就是(shì)所输入的文本。同一(yī)组关键词也可以创作出很多张风格不(bù)一样的(de)画作,这让(ràng)创作的过程(chéng)就像开盲盒(hé)。

很多用户很喜欢这种不(bù)确定(dìng)的(de)惊喜,他(tā)们会(huì)将生成的美图当做头(tóu)像(xiàng)。而另一部分喜欢(huān)翻看AI绘画的“翻车(chē)”作品。在社交媒体上,许(xǔ)多用户分享AI“翻车现场”,例如,一位网友的(de)小狗照片被AI画(huà)成(chéng)了“肌肉(ròu)男”,还有(yǒu)网友的个人照片被(bèi)AI识别(bié)成(chéng)了建(jiàn)筑。

而如今随着(zhe)ControlNet的出(chū)现与加持(chí),以往AI绘画的填写关键词游戏可能要(yào)被颠覆了(le)。

ChatGPT之后又一应(yīng)用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行业?_黑(hēi)料(liào)正能量

ControlNet是一(yī)位正(zhèng)在斯坦福读博(bó)的中国(guó)人张吕敏创作的一种基(jī)于控(kòng)制(zhì)点的(de)图(tú)像变形算法,主要用于数字图(tú)像处理(lǐ)、计(jì)算机视(shì)觉和计算机图形学等领域。

其SD插件一经发布,在短(duǎn)短(duǎn)的两(liǎng)天内便成(chéng)为了AI绘画领域最新的热点。

在此之前,大家用了很多(duō)方法想(xiǎng)让AI生(shēng)成的结果尽可能的符(fú)合要求(qiú),但是(shì)都(dōu)不尽如人意,它(tā)的出现代表着AI生成开(kāi)始(shǐ)进入真(zhēn)正的可(kě)控时期(qī)。

因(yīn)为ControlNet可以直接提取画面(miàn)的构(gòu)图,人(rén)物的姿势和画面的(de)深度信息等。有了它的帮助,就不用频繁的用(yòng)提示词来(lái)碰(pèng)运气,抽盲盒(hé)式的创作了。

通俗的说(shuō)ControlNet相当(dāng)于给AI绘(huì)画加了(le)“魔法(fǎ)”,不(bù)少博主的作品已经获得(dé)了(le)大量的(de)浏览量,“viggo”就是其中(zhōng)之一,他(tā)用朋友(yǒu)的(de)照片直接(jiē)带她们走进动漫(màn)世界(jiè)。

ChatGPT之后又一应用杀疯了,AIGC或进(jìn)入可控期,将洗牌科技行(xíng)业?_黑料正能(néng)量(liàng)

viggo先用(yòng)StableDiffusion图片转文字。

再(zài)用Text2Prompt插件拓展找到对应(yīng)的关(guān)键词;最后用ControlNet插(chā)件绑(bǎng)定骨骼开(kāi)始换关键词试效果。

ChatGPT之后(hòu)又一应用杀疯了,AIGC或进入可控期,将洗牌(pái)科技行业?_黑料正能(néng)量

通(tōng)过(guò)图(tú)片(piàn)就(jiù)可以(yǐ)看出来,效果十分惊艳。

ChatGPT之后(hòu)又一应用杀(shā)疯(fēng)了,AIGC或(huò)进入(rù)可控期,将洗牌科(kē)技行业?_黑料正(zhèng)能量

ChatGPT之后又(yòu)一应用(yòng)杀疯了,AIGC或(huò)进(jìn)入可控期,将(jiāng)洗(xǐ)牌科技行(xíng)业(yè)?_黑料(liào)正能量

更厉害的(de)是,除了真实的照片,草图也可(kě)以加上“魔法”,知(zhī)乎大牛“DevPoint”和“逗砂(shā)”介(jiè)绍到(dào)ControlNet还能实现(xiàn)线(xiàn)稿转全(quán)彩(cǎi)图。大神张吕敏其本尊也亲自回(huí)应。

ChatGPT之后(hòu)又一应用杀(shā)疯了,AIGC或进入可控期,将洗(xǐ)牌(pái)科技行业?_黑(hēi)料正能量

不得(dé)不说当下(xià)AIGC已经变得越来越(yuè)强(qiáng)大,甚至输出的作(zuò)品都已经(jīng)能以假乱真了。

02

难辨(biàn)虚实,AIGC技术力爆发(fā)

警(jǐng)惕安全问题

近日,“苏州金鸡(jī)湖有游(yóu)艇party”的消(xiāo)息火遍(biàn)网络,而经(jīng)过警方辟谣这所谓的“party”可(kě)能是(shì)全国第一起AI绘(huì)图(tú)诈骗。

由于这(zhè)个活动里面给出(chū)的(de)美女照片都是(shì)AI制作的(de)真人照片绘图,因为太(tài)逼真(zhēn),被大家当(dāng)成(chéng)真(zhēn)事(shì)传播了(le)

ChatGPT之后又一应用杀(shā)疯(fēng)了,AIGC或进入可控期(qī),将洗牌科技(jì)行业?_黑料正能量

不过仔细观察可以(yǐ)发(fā)现,活动发起(qǐ)者(zhě)提(tí)供的(de)照(zhào)片中(zhōng)有个很大(dà)的漏洞可(kě)以发现并非真人(rén),而是(shì)AI绘图,那便是图片中女性的手指部分(fēn)有的(de)存在异(yì)常。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进(jìn)入可控期,将(jiāng)洗牌科技(jì)行业?_黑料正能量

有行业人事(shì)表示:“现在因(yīn)为手(shǒu)指部分的绘(huì)画(huà)算法比较复杂,AI还不太(tài)会画人(rén)的手,但最新(xīn)看到的图片已经有越来越完美的AI模(mó)型出现,以后可能就完全(quán)没有(yǒu)漏洞(dòng)了。

类(lèi)似(shì)的AI作图(tú)诈骗(piàn)在国(guó)外(wài)也(yě)已(yǐ)有发生。据英国(guó)广播(bō)公司(sī)报道,土耳其地(dì)震期间,有(yǒu)Tiktok用户使用AI合成了儿童受灾的假照片发布(bù)到(dào)网(wǎng)络,以此诱骗善良的人(rén)打赏“捐助”从而实施(shī)诈(zhà)骗。

目前随着技术发展(zhǎn),AIGC已经能做(zuò)出真人照(zhào)片(piàn)般的绘图效果,如果这样的图片被用(yòng)来诈骗,将(jiāng)非常可怕。

此外AIGC还引发了(le)很多担忧(yōu),一(yī)方面,批判(pàn)者认为AI在“学习”了大量前(qián)人的(de)作(zuò)品之后,其创作没(méi)有任何情绪和灵魂,难以和人类(lèi)的(de)艺术创作(zuò)相提并(bìng)论。

另一方面,AIGC背后的版权、目前都(dōu)并没有得(dé)到有效的解决,还有AIGC会不会(huì)代替人类“至高无上”的(de)创意。

马斯克(kè)也强调,人工智(zhì)能的安全(quán)问题(tí)需要得到重视,太晚就来不及(jí)了。

03

AIGC下一(yī)站除(chú)了视(shì)频,还有远(yuǎn)方

技(jì)术都(dōu)是有两(liǎng)面性的,潜(qián)在的(de)危害并不能掩(yǎn)盖其光(guāng)辉(huī)的(de)贡献。现在看来,人工智能技术将是第四次工业(yè)革命的核心驱(qū)动力量,将创造新的增(zēng)长奇迹。

过(guò)去一年,人工智能在(zài)技术(shù)和商业层(céng)面都(dōu)有了巨大进展(zhǎn),AI绘画就是人工智能技术发生(shēng)方向性改变(biàn)的一个(gè)代(dài)表。其(qí)下一站或许就是(shì)视频。

此前(qián),Meta和谷(gǔ)歌先后发(fā)布了几条引爆(bào)科技圈的短视频。这些视频引(yǐn)发关注并非内容(róng)做得多优秀,反而都非常简单,比如一(yī)匹正在喝水的马(mǎ),一只画画的玩(wán)具(jù)熊,或者(zhě)一段(duàn)骑摩托车的(de)第一视(shì)角录像(xiàng),随便一(yī)个(gè)有(yǒu)手机的人都(dōu)可以随手录下一段。

ChatGPT之后又一应用杀疯(fēng)了,AIGC或进(jìn)入可控期,将洗(xǐ)牌科技行(xíng)业?_黑料正能量(liàng)

但(dàn)这些(xiē)短视频的创作方(fāng)式非常简单,创作者仅仅需要向AI输入一(yī)段话(huà),甚至只是说一下要求,AI就(jiù)可以根据(jù)需要生成一(yī)段视频(pín)。

谷歌(gē)发(fā)布的两(liǎng)个AI生(shēng)成视频分别来(lái)自于Imagen Video和Phenaki,前(qián)者主(zhǔ)要突出的是高清(qīng),与Meta的Make-A-Video没有太多的差别(bié)。

在(zài)Make-A-Video公布了AI生成(chéng)的视频(pín)后,AI圈就(jiù)已经玩了一波梗,一(yī)个能够做出更(gèng)高清视(shì)频(pín)的AI还不足以在短时(shí)间内戳中兴奋点。

Phenaki更加令人震惊(jīng)的地方(fāng)在(zài)于,它可以制作出(chū)超过(guò)2分钟的连贯(guàn)的也有确切内容(róng)的视频,这才是真正让人们感到惊喜的地(dì)方。因为(wèi)无论AI生成的视频(pín)多么高清(qīng),也只能是(shì)为内容(róng)生产者提供一(yī)个灵感(gǎn),一个素材(cái),一个过场动(dòng)画。

不过能够制作(zuò)出有(yǒu)具体剧情内容的视频就(jiù)意味着,一些(xiē)视(shì)频创作由(yóu)AI代(dài)替(tì)人(rén)工完成(chéng)已经(jīng)初步有了可能。

当(dāng)下AI的发展速度已(yǐ)经超(chāo)过大部分人(rén)的(de)想象。内(nèi)容产业的本质是供给创造需求,AIGC作为全新的(de)内容生产方式,可以(yǐ)为内容产业带(dài)来(lái)更新的内容风格、更快的生产速度,更低的生产(chǎn)成本,这无疑会(huì)驱动内容(róng)产业的大爆发。

除(chú)了AI绘图、视频,AIGC技术还能(néng)应用于(yú)音乐、代码、机器人(rén)动作等多(duō)种内容(róng)形式的(de)生成。不难发现(xiàn)该项技(jì)术不仅在游戏等行业能得到(dào)有效应用,对(duì)于(yú)下一代(dài)互联网各种(zhǒng)元素的构建亦有关键意(yì)义(yì)。

从商业化的角(jiǎo)度(dù)来(lái)看,文化娱(yú)乐、教育(yù)、传媒等诸多(duō)领域,本身就对基于AI的可(kě)视化内容有强烈需求。

因此,AI绘画及视频或不是结(jié)果,而只是AI进程中的一块重要拼图,有望在技术更新(xīn)的加持下(xià)实现更(gèng)大的应用价值。

AI从理解内(nèi)容,走向了可(kě)以生成内容,甚至能(néng)够(gòu)创造出独立价值和独立视角的内容。AIGC的再次出圈,更代表着未来的先进生(shēng)产力即将到(dào)来。

ChatGPT之后又一(yī)应用(yòng)杀(shā)疯(fēng)了,AIGC或进入可控期,将洗牌科技行业(yè)?_黑(hēi)料正能(néng)量

04

紧抓大模型(xíng)与算力(lì),牢固(gù)AIGC底(dǐ)座

从(cóng)技术的发展也可以(yǐ)看出,在(zài)语言大模(mó)型、图(tú)像大模型之后,多模态大(dà)模型已经成为了新的(de)趋势。

大模型被誉(yù)为当前人工智能发展的智能底座,是全球竞争最激(jī)烈(liè)的研究方向(xiàng)之一,包(bāo)括(kuò)谷(gǔ)歌、亚马逊(xùn)、百(bǎi)度、阿里(lǐ)、腾讯等(děng)众多头部企业(yè)都在竞相发力。

不过训练大(dà)模型(xíng)的(de)确(què)价(jià)格(gé)不菲(fēi),以国盛(shèng)证券(quàn)发布的《ChatGPT需要多少算(suàn)力》报(bào)告估算,GPT-3训练一次的成(chéng)本约为140万美元。而对(duì)于一些更大的LLM(大型语(yǔ)言模型(xíng)),训练(liàn)成本则(zé)介于200万美(měi)元至1200万美元高价之间。

以ChatGPT在2023年1月的(de)独立访客平均数1300万计算(suàn),其对(duì)应芯片(piàn)需求(qiú)为3万(wàn)多(duō)片英伟达A100 GPU,初始投入成(chéng)本约(yuē)为(wèi)8亿美元,每(měi)日仅(jǐn)电费就在5万(wàn)美(měi)元左右(yòu)。

ChatGPT之后(hòu)又(yòu)一应用杀(shā)疯了(le),AIGC或进入可控期,将洗牌(pái)科技行业?_黑(hēi)料正能量

此(cǐ)外不论是ChatGPT还是(shì)AIGC,都离不开庞大算力(lì)支持。在关(guān)注(zhù)各(gè)类(lèi)大模型的发(fā)展同时,更应(yīng)该关注算力(lì)网(wǎng)络(luò)的建(jiàn)设。

算力网络正驱(qū)动AI产业发(fā)展(zhǎn)进入(rù)史诗(shī)级加(jiā)速进程,让AIGC及通(tōng)用AI这一人(rén)工智能(néng)发展的终(zhōng)极目标离得(dé)更近。

因为算(suàn)力可(kě)以(yǐ)对突破性(xìng)技术创新提供大力的支持。这方(fāng)面,多模态大模型是典型(xíng)。作为面向未来强人工(gōng)智能、通用人工智能的重要技术(shù)创新,多模态大模型已经(jīng)在人工智能(néng)领域提(tí)出(chū)了很多年,业界也有不少技术突破(pò),但(dàn)是,多模(mó)态大模型进一步往下走,算力需求(qiú)呈几何式上(shàng)升,一(yī)般(bān)的算(suàn)力基础(chǔ)设施很快将难以胜任(rèn)。

从图像、文(wén)字、语(yǔ)音(yīn)单(dān)独一项(xiàng)的训练,到(dào)双模态(tài)、三模(mó)态的跃迁(qiān),让(ràng)人工(gōng)智能(néng)可以灵活应对不(bù)同模态的转化、像人与(yǔ)世界(jiè)交互一样自然,这方面,由算(suàn)力网络来驱(qū)动(dòng)将有明显优势。

ChatGPT之后又一应用杀疯了(le),AIGC或(huò)进入(rù)可控期(qī),将洗牌科(kē)技行业?_黑料正能量

此外,还有(yǒu)很多需要爆(bào)发式(shì)增长的算力来支撑的技(jì)术(shù)创新(xīn),将在人工智能(néng)算力网络支撑下(xià)快速推进。

AIGC已经露出曙光(guāng),期待在大模型和大算(suàn)力的支(zhī)持下AIGC能持(chí)续颠(diān)覆内容生产的方式(shì),将创造(zào)的边际(jì)成本降低,让万众受益。

未经允许不得转载:腾众软件科技有限公司 古诗山衔落日浸寒漪,山衔落日浸寒漪的诗意是什么

评论

5+2=