faceswap

GitHub
55.1k 13.4k 中等 137 次阅读 今天GPL-3.0开发框架图像
AI 解读 由 AI 自动生成,仅供参考

FaceSwap 是一款基于深度学习的开源工具,专注于实现图片和视频中的人脸自动识别与替换。通过训练神经网络模型,它能够精准捕捉面部特征并完成跨图像/视频的自然融合,例如将演员的面部表情迁移到另一张面孔上,或在视频中批量替换特定人脸。

这项技术降低了深度伪造技术的使用门槛,解决了传统AI换脸需要复杂代码能力和算力投入的难题。用户无需机器学习背景,即可通过图形化界面(GUI)完成从素材提取、模型训练到效果生成的全流程。其支持多种预训练模型(如Phaze-A、Villain),在消费级显卡上即可实现高质量输出。

适合数字内容创作者、影视特效爱好者、AI研究者及普通用户使用。设计师可将其用于创意视频制作,研究人员能基于开源框架探索生成对抗网络(GAN)的优化方案,而普通用户通过社区教程也能快速上手。项目提供详细的中文安装指南和活跃的Discord支持社区,兼顾不同技术层级的需求。

技术上采用卷积神经网络(CNN)实现面部关键点检测,并通过自编码器架构保持换脸后的自然光影过渡。其模型训练模块支持自定义数据集导入,为专业用户提供了算法调优空间。需要注意的是,开发者在宣言中强调技术的伦理使用,倡导将工具应用于创意表达、影视修复等正当场景。

使用场景

某独立电影制作团队在后期审查时,发现因主角档期冲突,部分关键镜头使用了替身演员,导致面部特征不连贯,严重影响观影体验。

没有 faceswap 时

  • 传统 VFX 流程需要美术师逐帧手工绘制修饰,耗时数周甚至数月,严重拖慢上映进度
  • 外包给专业特效公司费用高昂,单次修改就可能严重超出独立制作的有限预算
  • 合成效果往往生硬,肤色过渡与光影变化难以自然融合,观众容易察觉违和感
  • 团队成员需精通 After Effects 等专业软件,技术门槛高且前期学习成本巨大

使用 faceswap 后

  • faceswap 利用深度学习自动提取特征并训练模型,将数周的手工工作量压缩至几天内完成
  • faceswap 支持本地开源部署且无授权费用,显著降低制作成本,节省资金可用于其他环节
  • faceswap 生成结果逼真度高,算法自动匹配光源方向和表情细节,视觉过渡自然流畅
  • faceswap 提供友好的 GUI 界面和详细文档,普通后期人员经过简单培训即可上手操作

faceswap 通过自动化深度学习技术,让小型创作团队也能以低成本实现电影级的面部替换效果。

运行环境要求

操作系统
  • Windows
  • Linux
  • macOS
GPU

需要支持 CUDA 的现代 GPU 以获得最佳性能,Linux 下支持部分 AMD GPU (ROCm),具体显存和 CUDA 版本未说明

内存

未说明

依赖
notes完整安装步骤请参阅 INSTALL.md 文件。项目强调道德使用,禁止用于非法或不道德目的。技术支持可通过 Discord 服务器或官方论坛获取。
python未说明
ffmpeg (可选,用于视频处理)
faceswap hero image

快速开始

deepfakes_faceswap

PatreonPayPal 支持者的重要信息。请参阅此论坛帖子:https://forum.faceswap.dev/viewtopic.php?f=14&t=3120


FaceSwap 是一个利用深度学习 (Deep Learning) 来识别和交换图片及视频中人脸的工具。

    


使用 Phaze-A 模型进行的 Emma Stone/Scarlett Johansson 人脸交换


使用 Villain 模型进行的 Jennifer Lawrence/Steve Buscemi 人脸交换

Build Status Documentation Status

在开始之前,请务必查看 INSTALL.md

宣言

FaceSwap 具有符合伦理的用途。

当人脸交换技术最初被开发和发布时,这项技术是突破性的,它是人工智能 (AI) 发展的一大步。最初它在学术界之外被完全忽视,因为代码令人困惑且支离破碎。它需要对复杂的人工智能 (AI) 技术有透彻的理解,并且需要花费大量精力才能弄清楚。直到一个人将其整合成一个单一、连贯的集合。它可以运行,它可以工作,正如互联网上出现的新技术经常发生的那样,它立即被用于创建不当内容。尽管该软件最初被用于不当用途,但它是任何人都可以下载、运行并通过实验学习的第一段人工智能 (AI) 代码,而无需拥有数学、计算机理论、心理学等方面的博士学位 (Ph.D.)。在"deepfakes"之前,这些技术就像黑魔法,只有那些能够理解所有内部运作的人才能实践,正如那些深奥且无限复杂的书籍和论文中所描述的那样。

"Deepfakes"改变了这一切,任何人都可以参与人工智能 (AI) 开发。对我们开发者来说,这段代码的发布开启了一个绝佳的学习机会。它允许我们建立在他人开发的想法之上,与各种熟练的编码者合作,在学习新技能的同时实验人工智能 (AI),并最终为一项新兴技术做出贡献,随着技术的发展,这项技术只会看到更多的主流应用。

是否有人在使用类似软件做可怕的事情?是的。正因为如此,开发人员一直在遵循严格的道德标准。我们中的许多人甚至不使用它来创建视频,我们只是摆弄代码看看它能做什么。遗憾的是,媒体只关注该软件的不道德用途。不幸的是,这是它最初向公众曝光的性质,但这并不代表它被创建的原因、我们现在如何使用它,或者我们在其未来中看到什么。像任何技术一样,它可以用于善,也可以被滥用。我们的意图是以一种最小化其滥用潜力,同时最大化其作为学习、实验工具以及是的,用于合法人脸交换的潜力的方式来开发 FaceSwap。

我们并不是要贬低名人或侮辱任何人。我们是程序员,我们是工程师,我们是好莱坞视觉特效 (VFX) 艺术家,我们是活动家,我们是爱好者,我们是人类。为此,我们认为现在是时候发表一份标准声明,说明就我们开发者而言,这个软件是什么以及不是什么。

  • FaceSwap 不是用于创建不当内容。
  • FaceSwap 不是用于在未经同意的情况下或意图隐藏其使用的情况下更换人脸。
  • FaceSwap 不是用于任何非法、不道德或可疑的目的。
  • FaceSwap 的存在是为了实验和发现人工智能 (AI) 技术,用于社会或政治评论,用于电影,以及用于任何数量的道德和合理用途。

我们对 FaceSwap 可用于不道德和声名狼藉的事情感到非常不安。然而,我们支持开发可以合乎道德地使用的工具和技术,并为任何想要动手学习的人提供人工智能 (AI) 教育和经验。我们将对任何将此软件用于任何不道德目的的人采取零容忍态度,并将积极劝阻任何此类用途。

如何设置和运行项目

FaceSwap 是一个 Python 程序,可运行于多种操作系统 (Operating Systems),包括 Windows、Linux 和 MacOS。

请参阅 INSTALL.md 获取完整的安装说明。为了获得最佳性能,您需要一个支持 CUDA 的现代图形处理器 (GPU)。许多 AMD 图形处理器 (GPU) 通过 ROCm (Linux) 得到支持。

概述

该项目有多个入口点。你需要:

  • 收集照片和/或视频
  • 从原始照片中提取 (Extract) 人脸
  • 在从照片/视频中提取的人脸上训练 (Train) 模型 (model)
  • 使用模型 (model)转换 (Convert) 你的源文件

查看 USAGE.md 获取更详细的说明。

提取 (Extract)

在你的设置文件夹中,运行 python faceswap.py extract。这将从 src 文件夹获取照片并将人脸提取到 extract 文件夹中。

训练 (Train)

在你的设置文件夹中,运行 python faceswap.py train。这将从两个包含两张人脸照片的文件夹中获取图片,并训练一个模型 (model),该模型将保存在 models 文件夹内。

转换 (Convert)

在你的设置文件夹中,运行 python faceswap.py convert。这将从 original 文件夹获取照片并将新人脸应用到 modified 文件夹中。

图形用户界面 (GUI)

或者,你可以通过运行 python faceswap.py gui 来启动图形用户界面 (GUI)。

一般注意事项:

  • 所有提到的脚本都有 -h/--help 选项,显示它们接受的参数。你很聪明,你能弄明白这是怎么工作的,对吧?!

注意 (NB):有一个用于视频的工具。可以通过运行 python tools.py effmpeg -h 访问。或者,你可以使用 ffmpeg 将视频转换为照片,处理图像,然后再将图像转换回视频。

一些提示:

重用现有模型 (model) 的训练速度比从头开始快得多。 如果没有足够的训练数据,先从看起来相似的人开始,然后切换数据。

帮助,我需要支持!

Discord 服务器

最好的选择是加入 FaceSwap Discord 服务器,那里有很多愿意帮助的用户。请注意,像这个仓库 (repo) 一样,这是一个适合工作场所 (SFW) 的服务器!

FaceSwap 论坛

或者,你可以在 FaceSwap 论坛 发帖提问。请不要在这个仓库 (repo) 中发布一般支持问题,因为它们可能会被删除且不予回复。

捐赠

开发人员 (Dev) 不知疲倦地改进和开发 FaceSwap。为了提供如今的软件,他们投入了许多小时,但这是一个极其耗时且没有经济回报的过程。如果你喜欢使用该软件,请考虑向开发人员 (Dev) 捐赠,以便他们能花更多时间实施改进。

Patreon

支持我们的最佳方式是通过我们的 Patreon 页面:

become-a-patron

一次性捐赠

或者,你可以向我们的任何开发人员 (Dev) 进行一次性的捐赠:

@torzdf

很少有 FaceSwap 代码未经过 torzdf 的处理。他负责实现图形用户界面 (GUI)、FAN 对齐器 (FAN aligner)、MTCNN 检测器 (MTCNN detector),并将 Villain、DFL-H128 和 DFaker 模型 (model) 移植到 FaceSwap,以及显著改进了代码的许多领域。

Bitcoin: bc1qpm22suz59ylzk0j7qk5e4c7cnkjmve2rmtrnc6

Ethereum: 0xd3e954dC241B87C4E8E1A801ada485DC1d530F01

Monero: 45dLrtQZ2pkHizBpt3P3yyJKkhcFHnhfNYPMSnz3yVEbdWm3Hj6Kr5TgmGAn3Far8LVaQf1th2n3DJVTRkfeB5ZkHxWozSX

Paypal: torzdf

@andenixa

Unbalanced 和 OHR 模型 (model) 的创建者,并扩展了训练过程中的各种功能。Andenixa 目前正在研究新模型 (model),并将接受捐赠请求。

Paypal: andenixa

如何贡献

对于对生成模型 (generative models) 感兴趣的人

  • 前往 'faceswap-model' 讨论/建议/提交当前算法 (algorithm) 的替代方案。

对于开发人员 (Dev)

  • 完整阅读本 README
  • Fork (分叉) 这个仓库 (repo)
  • 尝试使用它
  • 查看带有 'dev' 标签的问题
  • 对于对计算机视觉 (computer vision) 和 openCV 更感兴趣的开发人员 (Dev),查看带有 'opencv' 标签的问题。也欢迎添加你自己的替代方案/改进

对于非开发人员 (Dev) 的进阶用户

  • 完整阅读本 README
  • Clone (克隆) 这个仓库 (repo)
  • 尝试使用它
  • 查看带有 'advuser' 标签的问题
  • 同时前往 'faceswap 论坛' 帮助他人。

对于最终用户

  • 在这里获取代码并尝试使用它(如果可以的话)
  • 你也可以前往 faceswap 论坛 帮助他人或获取帮助。
  • 要有耐心。这对开发人员 (Dev) 来说也是一项相对较新的技术。已经投入了大量精力使该程序易于普通用户使用。这只是需要时间!
  • 注意 任何与运行代码相关的问题必须在 faceswap 论坛 中提出!

关于机器学习 (machine learning)

计算机如何知道如何识别/塑造人脸?机器学习 (machine learning) 如何工作?什么是神经网络 (neural network)?

这很复杂。这里有一个很好的视频可以让过程易于理解: How Machines Learn

这里有一个稍微更深入的视频,试图解释神经网络 (neural network) 的基本功能: How Machines Learn

太长不看 (tl;dr):训练数据 + 试错

版本历史

v3.0.02025/12/21
v2.3.02025/12/19
v2.2.02023/06/18
v1.0.02020/08/14
v0.902019/02/23

常见问题

相似工具推荐

stable-diffusion-webui

stable-diffusion-webui 是一个基于 Gradio 构建的网页版操作界面,旨在让用户能够轻松地在本地运行和使用强大的 Stable Diffusion 图像生成模型。它解决了原始模型依赖命令行、操作门槛高且功能分散的痛点,将复杂的 AI 绘图流程整合进一个直观易用的图形化平台。 无论是希望快速上手的普通创作者、需要精细控制画面细节的设计师,还是想要深入探索模型潜力的开发者与研究人员,都能从中获益。其核心亮点在于极高的功能丰富度:不仅支持文生图、图生图、局部重绘(Inpainting)和外绘(Outpainting)等基础模式,还独创了注意力机制调整、提示词矩阵、负向提示词以及“高清修复”等高级功能。此外,它内置了 GFPGAN 和 CodeFormer 等人脸修复工具,支持多种神经网络放大算法,并允许用户通过插件系统无限扩展能力。即使是显存有限的设备,stable-diffusion-webui 也提供了相应的优化选项,让高质量的 AI 艺术创作变得触手可及。

162.1k|★★★☆☆|今天
开发框架图像Agent

everything-claude-code

everything-claude-code 是一套专为 AI 编程助手(如 Claude Code、Codex、Cursor 等)打造的高性能优化系统。它不仅仅是一组配置文件,而是一个经过长期实战打磨的完整框架,旨在解决 AI 代理在实际开发中面临的效率低下、记忆丢失、安全隐患及缺乏持续学习能力等核心痛点。 通过引入技能模块化、直觉增强、记忆持久化机制以及内置的安全扫描功能,everything-claude-code 能显著提升 AI 在复杂任务中的表现,帮助开发者构建更稳定、更智能的生产级 AI 代理。其独特的“研究优先”开发理念和针对 Token 消耗的优化策略,使得模型响应更快、成本更低,同时有效防御潜在的攻击向量。 这套工具特别适合软件开发者、AI 研究人员以及希望深度定制 AI 工作流的技术团队使用。无论您是在构建大型代码库,还是需要 AI 协助进行安全审计与自动化测试,everything-claude-code 都能提供强大的底层支持。作为一个曾荣获 Anthropic 黑客大奖的开源项目,它融合了多语言支持与丰富的实战钩子(hooks),让 AI 真正成长为懂上

139k|★★☆☆☆|今天
开发框架Agent语言模型

ComfyUI

ComfyUI 是一款功能强大且高度模块化的视觉 AI 引擎,专为设计和执行复杂的 Stable Diffusion 图像生成流程而打造。它摒弃了传统的代码编写模式,采用直观的节点式流程图界面,让用户通过连接不同的功能模块即可构建个性化的生成管线。 这一设计巧妙解决了高级 AI 绘图工作流配置复杂、灵活性不足的痛点。用户无需具备编程背景,也能自由组合模型、调整参数并实时预览效果,轻松实现从基础文生图到多步骤高清修复等各类复杂任务。ComfyUI 拥有极佳的兼容性,不仅支持 Windows、macOS 和 Linux 全平台,还广泛适配 NVIDIA、AMD、Intel 及苹果 Silicon 等多种硬件架构,并率先支持 SDXL、Flux、SD3 等前沿模型。 无论是希望深入探索算法潜力的研究人员和开发者,还是追求极致创作自由度的设计师与资深 AI 绘画爱好者,ComfyUI 都能提供强大的支持。其独特的模块化架构允许社区不断扩展新功能,使其成为当前最灵活、生态最丰富的开源扩散模型工具之一,帮助用户将创意高效转化为现实。

107.7k|★★☆☆☆|2天前
开发框架图像Agent

NextChat

NextChat 是一款轻量且极速的 AI 助手,旨在为用户提供流畅、跨平台的大模型交互体验。它完美解决了用户在多设备间切换时难以保持对话连续性,以及面对众多 AI 模型不知如何统一管理的痛点。无论是日常办公、学习辅助还是创意激发,NextChat 都能让用户随时随地通过网页、iOS、Android、Windows、MacOS 或 Linux 端无缝接入智能服务。 这款工具非常适合普通用户、学生、职场人士以及需要私有化部署的企业团队使用。对于开发者而言,它也提供了便捷的自托管方案,支持一键部署到 Vercel 或 Zeabur 等平台。 NextChat 的核心亮点在于其广泛的模型兼容性,原生支持 Claude、DeepSeek、GPT-4 及 Gemini Pro 等主流大模型,让用户在一个界面即可自由切换不同 AI 能力。此外,它还率先支持 MCP(Model Context Protocol)协议,增强了上下文处理能力。针对企业用户,NextChat 提供专业版解决方案,具备品牌定制、细粒度权限控制、内部知识库整合及安全审计等功能,满足公司对数据隐私和个性化管理的高标准要求。

87.6k|★★☆☆☆|今天
开发框架语言模型

ML-For-Beginners

ML-For-Beginners 是由微软推出的一套系统化机器学习入门课程,旨在帮助零基础用户轻松掌握经典机器学习知识。这套课程将学习路径规划为 12 周,包含 26 节精炼课程和 52 道配套测验,内容涵盖从基础概念到实际应用的完整流程,有效解决了初学者面对庞大知识体系时无从下手、缺乏结构化指导的痛点。 无论是希望转型的开发者、需要补充算法背景的研究人员,还是对人工智能充满好奇的普通爱好者,都能从中受益。课程不仅提供了清晰的理论讲解,还强调动手实践,让用户在循序渐进中建立扎实的技能基础。其独特的亮点在于强大的多语言支持,通过自动化机制提供了包括简体中文在内的 50 多种语言版本,极大地降低了全球不同背景用户的学习门槛。此外,项目采用开源协作模式,社区活跃且内容持续更新,确保学习者能获取前沿且准确的技术资讯。如果你正寻找一条清晰、友好且专业的机器学习入门之路,ML-For-Beginners 将是理想的起点。

85k|★★☆☆☆|今天
图像数据工具视频

ragflow

RAGFlow 是一款领先的开源检索增强生成(RAG)引擎,旨在为大语言模型构建更精准、可靠的上下文层。它巧妙地将前沿的 RAG 技术与智能体(Agent)能力相结合,不仅支持从各类文档中高效提取知识,还能让模型基于这些知识进行逻辑推理和任务执行。 在大模型应用中,幻觉问题和知识滞后是常见痛点。RAGFlow 通过深度解析复杂文档结构(如表格、图表及混合排版),显著提升了信息检索的准确度,从而有效减少模型“胡编乱造”的现象,确保回答既有据可依又具备时效性。其内置的智能体机制更进一步,使系统不仅能回答问题,还能自主规划步骤解决复杂问题。 这款工具特别适合开发者、企业技术团队以及 AI 研究人员使用。无论是希望快速搭建私有知识库问答系统,还是致力于探索大模型在垂直领域落地的创新者,都能从中受益。RAGFlow 提供了可视化的工作流编排界面和灵活的 API 接口,既降低了非算法背景用户的上手门槛,也满足了专业开发者对系统深度定制的需求。作为基于 Apache 2.0 协议开源的项目,它正成为连接通用大模型与行业专有知识之间的重要桥梁。

77.1k|★★★☆☆|昨天
Agent图像开发框架