您現(xiàn)在的位置是:首頁(yè) >每日動(dòng)態(tài) > 2024-06-04 14:35:01 來(lái)源:
AI領(lǐng)域的賽博佛祖,他的名字,叫張呂敏。
前兩天,AI繪圖圈的賽博佛祖張呂敏,又出手了,發(fā)了一個(gè)挺牛逼的新項(xiàng)目,叫Omost。
簡(jiǎn)而言之,Omost的作用就是,把簡(jiǎn)單的一句話,擴(kuò)展成非常牛逼、詳細(xì)且精準(zhǔn)的Prompt,然后挨個(gè)畫(huà)出各種不同的區(qū)域,最后合成在一起。
注意,是合成,所以精準(zhǔn)可控能力極強(qiáng)。
非常牛逼的自動(dòng)繪圖的Agent,從此,人人都可以不被所謂的Prompt困擾,普通人用一句話,也能生成很不錯(cuò)的圖片。
有一個(gè)東西跟Omost用的是同樣的技術(shù)路線,它叫Dalle3。
但是,Dalle3畢竟是OpenAI的玩意,你只能付費(fèi)氪金用,沒(méi)有開(kāi)源。
但是Omost,開(kāi)源。
我的小伙伴@祁玨瑜第一時(shí)間做了一個(gè)本地整合包扔給了我,在我玩了2天后,只能感嘆一句:
太強(qiáng)了。
比如我想畫(huà)一個(gè)飛船,我就在輸入框中直接輸入“太空中的未來(lái)飛船”,他就會(huì)開(kāi)始哐哐給我寫(xiě)代碼。
這些代碼可能很多朋友看不懂,我翻譯成中文的你們就知道了。
可以理解成把畫(huà)面拆成了了九份,九宮格,畫(huà)面中心是什么,畫(huà)面左上方是什么,右下方是什么,然后挨個(gè)去繪制,最后合在一起。
當(dāng)把所有的代碼輸出完后,我們直接點(diǎn)渲染就行,一幅飛船圖就出來(lái)了~
也可以跟Dalle3一樣,再進(jìn)行對(duì)話式的區(qū)域修改,比如把背景從太空換成海洋等等。
但是目前還沒(méi)法接入到SD生態(tài)里去,大模型也是封裝好的。
大語(yǔ)言模型用的是Llama3-8b,繪圖模型用的是RealVisXL V4.0。
本地有8G顯存就能跑起來(lái)。
整合包我扔公眾號(hào)后臺(tái)了,對(duì)著公眾號(hào)私信“O”這個(gè)英文字母就有。下載下來(lái)解壓完后,第一次先運(yùn)行env.bat,然后再運(yùn)行run.bat就行了。以后每次打開(kāi),就只需要運(yùn)行一下run.bat。
不過(guò)Omost畢竟開(kāi)源了,肯定會(huì)有無(wú)數(shù)大佬,基于Omost上進(jìn)行魔改,接入到WebUI和ComfyUI也肯定指日可待。
Omeost強(qiáng)是強(qiáng),但是讓我更感慨,覺(jué)得更強(qiáng)的,是Omeost的作者。
賽博佛祖,張呂敏。
可能有些小伙伴對(duì)這個(gè)人名非常陌生,但是如果我說(shuō)一個(gè)他最著名的開(kāi)源項(xiàng)目,相信只要是玩AI繪圖的,肯定都不會(huì)陌生了。
那個(gè)項(xiàng)目,叫ControlNET。
讓AI生圖實(shí)現(xiàn)多種手段自主可控,一舉將SD生態(tài)推向了繁榮,讓AI繪圖進(jìn)入N多B端工作流,實(shí)現(xiàn)全面商業(yè)化的始作俑者。說(shuō)它是SD生態(tài)最大的功臣也不為過(guò)。
這些,全都是ControlNET干的,可以說(shuō),ControlNET是AI行業(yè)精準(zhǔn)控圖的爹。
而張呂敏,是ControlNET的爹。
而張呂敏的工作,除了ControlNET這種爆炸性的項(xiàng)目之外,還有面向普通人的傻瓜且小白的AI繪圖產(chǎn)品Fooocus,開(kāi)源的。
后面又發(fā)了一個(gè)Fordge UI,對(duì)原生的SD WebUI推理進(jìn)行加速等各方面優(yōu)化。在6G低顯存上可以提高60-75%的生成速度,8G顯存上可以提高大約30~45% 的速度。讓AI繪圖的門(mén)檻進(jìn)一步被拉低。
還有LayerDiffusion,一個(gè)可以用AI直接生成原生的帶有透明背景的PNG圖片的插件,效果比生產(chǎn)完再用PS啥的摳圖的效果完美多了,甚至連玻璃的透明效果都能直接生成出來(lái),重點(diǎn)還是:開(kāi)源的。
IC-Light,可以重新打光,讓人物和背景光線完美融合,實(shí)現(xiàn)主體與背景迅速統(tǒng)一在同一光源,還是:開(kāi)源的。
等等等等。
他在Github上,有無(wú)數(shù)的star,而頭像,是一個(gè)很反差很喜感的英短。
可以說(shuō),張呂敏他本人,就是整個(gè)AI繪圖領(lǐng)域的,賽博佛祖。
本人也非常的年輕,2021年本科畢業(yè)于蘇州大學(xué),現(xiàn)在在斯坦福大學(xué)計(jì)算機(jī)科學(xué)專(zhuān)業(yè)讀博。
但是他,在18年,可能還沒(méi)進(jìn)入大學(xué)校園時(shí),就已經(jīng)在研究人工智能了。
18年,他發(fā)了兩款A(yù)I繪圖產(chǎn)品,一個(gè)叫Mangacaft,給黑白漫畫(huà)AI一鍵上色。一個(gè)叫Style2Paints,給線稿用AI一鍵上色。
在19年,我跟Style2Paints,還有過(guò)一段很有趣的交集。
那時(shí)候在公司,我們?cè)O(shè)計(jì)團(tuán)隊(duì)發(fā)起了一個(gè)項(xiàng)目,是做一個(gè)小游戲,類(lèi)似于王權(quán)那種左滑右滑做抉擇的。想法很美好,但是現(xiàn)實(shí)很骨感,游戲卡牌的插圖,我們?nèi)米约寒?huà),有整整將近400張。
那時(shí)候沒(méi)有什么AI,真的全得靠人。
我們的幾個(gè)插畫(huà)師,不眠不休肝了一兩個(gè)禮拜,肝出來(lái)了近400張線稿,然后我們對(duì)著這400張線稿犯了難,畢竟還要上色。。。那是一個(gè)比畫(huà)線稿還恐怖的工作。
我一度覺(jué)得這事不該人干,于是就去網(wǎng)上翻,翻到了lks的視頻,他推薦了一個(gè)很有趣的AI上色工具,就叫:Mangacaft。
我順著這個(gè)產(chǎn)品,找到了張呂敏的Github,找到了他的符合我需求的另一款線稿AI上色工具:Style2Paints。
然后用這個(gè)產(chǎn)品,就花了幾天時(shí)間,幫我直接搞定了屬于我的所有的上色任務(wù),然后,開(kāi)開(kāi)心心的摸了很多天的魚(yú)。
那時(shí)候,我還不知道他叫張呂敏,那個(gè)時(shí)候,我也更是想象不到,6年后的今天,全世界都知道了他的名字,他成了我們心中的,神。
這六年,他的初心,好像也從來(lái)沒(méi)有變過(guò)。
六年前,他的Mangacaft和Style2Paints就是在線服務(wù)免費(fèi)給大家用。
而Mangacaft,收益很凄慘。
他也有過(guò)迷茫。
也有抓耳撓腮的時(shí)候。
網(wǎng)站關(guān)了開(kāi),開(kāi)了關(guān),但是還是一直在開(kāi)心的做著自己喜歡的事情。
就這樣,一直做,一直做。
然后,他做出了ControlNET、做出了LayerDiffusion、IC-Light、Fooocus,也做出了Omost。
現(xiàn)在,他成了張呂敏,成了我們心中的,賽博佛祖。
18年,24年。
我非常佩服他,更是非常的羨慕他,他能做到那么多人都做不到的事,把心中的美好帶給所有人,那一股子初心和激情,我非常的羨慕。
我也想成為那樣的人,但是也清楚,我實(shí)在太菜了。所以也只能做一點(diǎn),我自己力所能及的小事,去盡可能的追逐他們的背影吧。
最后,我想用張呂敏曾經(jīng)轉(zhuǎn)發(fā)過(guò)的一句話做結(jié)尾,那句話,最近也挺火。
為天地立心,為生民立命,為往圣繼絕學(xué),為萬(wàn)世開(kāi)太平。
我想,這就是,最大的意義吧。
猜你喜歡
最新文章
點(diǎn)擊排行
- 董宇輝稱高考不決定人生:人生是一場(chǎng)漫長(zhǎng)的“馬拉松”
- 公孫離是誰(shuí)的cp(公孫離是誰(shuí)的老婆)
- 半年間市值漲了1000億:“小兄弟”攜程趕超百度
- 不知老之將至云爾的前一句(不知老之將至)
- RCEP全面實(shí)施一年來(lái),廣東口岸進(jìn)口稅收減讓3.5億元
- 排擠和孤立是一個(gè)意思嗎(排擠)
- 七參數(shù)坐標(biāo)轉(zhuǎn)換(坐標(biāo)轉(zhuǎn)換)
- 利率市場(chǎng)化改革的內(nèi)容(利率市場(chǎng)化改革)
- “天目智能”獲數(shù)千萬(wàn)元Pre-A輪戰(zhàn)略融資