LivePortrait：一種讓照片動起來的開源技術方案

當前位置：點晴教程→知識管理交流 →『技術文檔交流』

liguoquan

2024年11月30日 11:1 本文熱度 1463

：LivePortrait：一種讓照片動起來的開源技術方案

LivePortrait：一種讓照片動起來的開源技術方案

LivePortrait 是能讓照片動起來的開源技術方案。需提供“誰動”和“如何動”的素材，試用網址用于研究學習。它高效且可控，論文有原理介紹。技術人員可參考官方文檔搭建，包括創建新環境、下載源碼和準備運行環境等，還需下載模型權重，最后執行命令生成結果，更多內容見官方說明。

關聯問題:LivePortrait要付費嗎模型權重在哪下載自己搭建難不難

有一款開源項目，它主要功能就是讓靜態照片動起來。

你只需要提供兩個素材，第一個素材是讓誰動。就比如下面的這個兵馬俑。

第二個素材是如何動，就比如下面這個視頻。

然后，將這倆數據交給開源項目處理，最終就得出如下結果。

不但對一個人有效，多個人也可以了。

不但對人類有效，萌寵動物或者二次元也行。

試用網址是：huggingface.co/spaces/Kwai… 這個網址是研究和學習用的。

只需要上傳那兩個素材，然后點擊確定。

就可以獲得一個會動的視頻。

好了。上面這些操作，其實就可以賣錢了。

有很多人利用信息差，白嫖這項開源技術。用上面的網址，制作一些親人照片懷念視頻、萌寵搞怪視頻進行售賣。你得開個會員，或者花上九塊九才能使用一次。

下面部分內容是給技術人員看的。如果你對此感興趣，想進一步了解其中的原理，可以繼續閱讀。

這項開源框架叫LivePortrait，它是具有拼接和重定向控制的高效肖像動畫。它的論文概要內容如下：

肖像動畫旨在從單一源圖像合成逼真的視頻，將其用作外觀參考。我們沒有遵循主流的基于擴散的方法，而是探索和擴展了基于隱式關鍵點的框架的潛力，從而有效地平衡了計算效率和可控性。為了提高生成質量和泛化能力，我們將訓練數據擴展到大約6900萬個高質量幀，采用混合圖像-視頻訓練策略，升級網絡架構，并設計更好的運動轉換和優化目標。此外，我們發現緊湊的隱式關鍵點可以有效地表示一種混合形狀，并精心提出了一個拼接和兩個重新定位模塊，它們利用一個計算開銷可忽略不計的小型MLP來增強可控性。實驗結果表明，與基于擴散的方法相比，我們的框架是有效的。在RTX 4090 GPU上使用 PyTorch的生成速度顯著達到12.8毫秒。推理代碼和模型可在 github.com/KwaiVGI/Liv… 獲得。

技術人員如何自己搭建呢？

對于技術人員，最直觀的方式就是去官方的ReadMe.md文檔查看 github.com/KwaiVGI/Liv…

這里面不但有入門操作，項目源碼，還有版本更新說明。

比如在7月19日，框架開始支持視頻編輯，又名v2v。照片到視頻是p2v，即picture to video。v2v就是視頻到視頻。

圖片到視頻是讓靜態圖片動起來，感覺很有用。

但是視頻到視頻有什么用呢？

舉個例子，比如有個美女跳舞，她走的是冷酷風。但是老板想讓她走嘻哈風，但是美女就是不從。這時就可以找個愛笑的女孩子，通過v2v讓不愛笑的美女笑起來。

其實，你們網上看得那些武松和潘金蓮、孫悟空和白骨精的改編版，估計用的也是v2v這項技術。

好了，下面就說說如何搭建和使用。7月25日，官方發布了安裝包，可以通過下載安裝包直接使用。甚至連搭建都不用了。解壓即可使用。

兩個下載地址如下：

huggingface.co/cleardusk/L…
pan.baidu.com/s/1FWsWqKe0…

如果，你還有執念，就是想自己搭建，并且融于到自己的產品中。那么繼續往下看。

我們用conda管理環境，首先要準備一個新環境。相當于給項目批了一塊地。

ini代碼解讀復制代碼conda create -n LivePortrait python=3.9 conda activate LivePortrait

然后，將源碼下載下來，存放到一個位置。并且進入文件目錄。

bash代碼解讀復制代碼git clone https://github.com/KwaiVGI/LivePortrait cd LivePortrait

下載源碼，可以用git形式。也可以直接下載zip文件。

第三步，準備運行支持環境。上面新建了一個環境，批了一塊地。現在要進行裝修和水電網的鋪設。安裝采用pip。

bash代碼解讀復制代碼# Linux和Windows用戶執行這個 pip install -r requirements.txt # macOS用戶用這個 pip install -r requirements_macOS.txt

requirements.txt里面是：

ini代碼解讀復制代碼-r requirements_base.txt onnxruntime-gpu==1.18.0

requirements_macOS.txt里面是：

ini代碼解讀復制代碼-r requirements_base.txt onnxruntime-silicon==1.16.3

他們都有requirements_base.txt，然后區分了一些系統特性。

我們看requirements_base.txt里面是這樣：

ini代碼解讀復制代碼--extra-index-url https://download.pytorch.org/whl/cu118 torch==2.3.0 torchvision==0.18.0 torchaudio==2.3.0  numpy==1.26.4 pyyaml==6.0.1 opencv-python==4.10.0.84 scipy==1.13.1 imageio==2.34.2 lmdb==1.4.1 tqdm==4.66.4 rich==13.7.1 ffmpeg-python==0.2.0 onnx==1.16.1 scikit-image==0.24.0 albumentations==1.4.10 matplotlib==3.9.0 imageio-ffmpeg==0.5.1 tyro==0.8.5 gradio==4.37.1 pykalman==0.9.7

很明顯，它是需要GPU的。就算是你下載上面那個windows版本的壓縮包，也需要你電腦具有GPU。

準備完環境就具備了運行資格。下一步是下載模型權重。不用你訓練，只需要你下載人家訓練好的模型，放到你電腦中使用即可。

官方的給出的方式比較國際化：

bash代碼解讀復制代碼git clone https://huggingface.co/KwaiVGI/LivePortrait temp_pretrained_weights mv temp_pretrained_weights/* pretrained_weights/ rm -rf temp_pretrained_weights

其實，在實際操作中，一般很難執行。最好還是去用瀏覽器下載，然后放到文件目錄中。

以下是百度云下載地址：

pan.baidu.com/share/init?…

下載完了，讓文件解壓并將它們放在./pretrained_weights。其實這一步和上面命令行執行的步驟一樣。哪一個能走通，更好實現，就走哪一步。

但是，不管怎樣，你要確保最終存放模型的文件夾里是這樣的結構：

markdown代碼解讀復制代碼pretrained_weights ├── insightface │   └── models │       └── buffalo_l │           ├── 2d106det.onnx │           └── det_10g.onnx └── liveportrait     ├── base_models     │   ├── appearance_feature_extractor.pth     │   ├── motion_extractor.pth     │   ├── spade_generator.pth     │   └── warping_module.pth     ├── landmark.onnx     └── retargeting_models         └── stitching_retargeting_module.pth

最后一步啦，最后一步！開始享受使用過程！準備好兩類素材，一個讓什么動，一般是圖片(假設名字叫p.jpg)。另一個如何動，一般是視頻(假設名字叫v.mp4)。然后在環境中，在項目目錄下，執行以下命令：

css代碼解讀復制代碼python inference.py -s p.jpg -d v.mp4

此時會在animations文件夾下生成結果。

如果你一時間找不到素材，也可以使用項目里提供的素材。位置在 assets/examples/下。里面有圖片也有視頻。

如果想要操作視頻到視頻，命令如下：

代碼解讀復制代碼python inference.py -s v1.mp4 -d v2.mp4

關于更多的內容，開發者可以去看官方說明，里面講解的很詳細

該文章在 2024/11/30 11:01:32 編輯過

關鍵字查詢

正在查詢...

點晴ERP是一款針對中小制造業的專業生產管理軟件系統,系統成熟度和易用性得到了國內大量中小企業的青睞。

點晴PMS碼頭管理系統主要針對港口碼頭集裝箱與散貨日常運作、調度、堆場、車隊、財務費用、相關報表等業務管理，結合碼頭的業務特點，圍繞調度、堆場作業而開發的。集技術的先進性、管理的有效性于一體，是物流碼頭及其他港口類企業的高效ERP管理信息系統。

點晴WMS倉儲管理系統提供了貨物產品管理,銷售管理,采購管理,倉儲管理,倉庫管理,保質期管理,貨位管理,庫位管理,生產管理,WMS管理系統,標簽打印,條形碼,二維碼管理,批號管理軟件。

點晴免費OA是一款軟件和通用服務都免費，不限功能、不限時間、不限用戶的免費OA協同辦公管理系統。

狠狠色丁香婷婷综合尤物/久久精品综合一区二区三区/中国有色金属学报/国产日韩欧美在线观看 - 国产一区二区三区四区五区tv

LivePortrait：一種讓照片動起來的開源技術方案

LivePortrait：一種讓照片動起來的開源技術方案