整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

Code2prompt:探索高效代码编辑新纪元的开源

Code2prompt:探索高效代码编辑新纪元的开源模型工具

目介绍

Code2prompt 是一个命令行工具,能将你的代码库转化为单一的大型语言模型(LLM)提示,结合源码树结构,模板定制,以及令牌计数。它旨在简化与高级上下文窗口模型如GPT或Claude的交互,助你在重写代码、查找bug、编写文档和实现新功能等方面提升效率。通过将你·的整个项目转换为一个全面的、对 AI 友好的提示,Code2Prompt 使你能够充分利用 AI 的潜力进行代码分析、文档和改进任务。

项目应用场景

代码迁移:想把代码从一种编程语言转换到另一种?只需提供一个目标语言的模板,让LLM来完成任务。

错误检测:利用code2prompt生成的提示,让LLM识别潜在的安全漏洞或编码错误。

文档生成:自动为代码添加注释,提高代码可读性。

性能优化:通过调整代码结构,提高代码执行效率。

版本控制:基于git的变更,生成有意义的提交消息。

项目特点整体代码库表示:生成一个结构良好的 Markdown 提示,以捕捉整个项目的本质。

智能源代码树生成:创建代码库结构的清晰分层视图。

可自定义的提示模板:使用 Jinja2 模板定制您的输出以适应特定的 AI 任务。

智能令牌管理:对令牌进行计数和优化,以确保与各种 LLM 令牌限制兼容。

Gitignore集成:尊重项目的 .gitignore 规则,以获得准确的表示。

灵活的文件处理:使用强大的 glob 模式过滤和排除文件。

剪贴板就绪:立即将生成的提示复制到剪贴板,以便进行快速的 AI 交互。

增强的代码可读性:将行号添加到源代码块中,以便精确引用。

项目使用及实例

Code2Prompt 的基本语法为:

对于多条路径:

命令参数

--filter或 和 或-f--exclude-e 和选项允许您分别指定应包含在处理中或从处理中排除的文件或目录的模式。--filter--exclude

语法

使用实例

从单个 Python 文件生成提示:

处理整个项目目录并保存输出:

为多个文件生成提示,不包括测试:

Code2Prompt 中的令牌和配置文件

标记是语言模型处理的文本的基本单位。它们可以是单词、单词的一部分,甚至是标点符号。不同的分词器编码以不同的方式将文本拆分为分割令牌。Code2Prompt 通过其选项支持多种令牌类型,默认为“cl100k_base”。GPT-3.5 和 GPT-4 等模型使用的这种编码擅长处理代码和技术内容。其他常见的编码包括“p50k_base”(由早期的 GPT-3 模型使用)和“r50k_base”(由 CodeX 等模型使用)。若要在生成的提示中计算令牌,请使用以下标志:

对于特定编码:

Code2Prompt 支持 JSON 格式的配置文件来设置默认选项。将此文件放在您的项目或主目录中,例:

安装与使用

从发布页面下载适合你操作系统的预编译二进制文件,或者使用cargo安装:

cargo install code2prompt

然后,你可以根据需要调用code2prompt并指定相应参数,例如:

code2prompt path/to/codebase

借助code2prompt,你将释放出LLM的潜力,使代码工作流更智能、更高效。立即尝试,开启你的高效开发之旅吧!

更多详细内容:https://github.com/raphaelmansuy/code2prompt?tab=readme-ov-file

高性价比GPU算力:https://www.ucloud.cn/site/active/gpu.html?ytag=gpu_wenzhang_0710_shemei

器之心专栏

机器之心编辑部

本文提出了一个名为 SpeechGen 的统一框架,该框架可用于任意的 speech LM 及各类语音生成任务,具有很好的潜力。

论文链接:https://arxiv.org/pdf/2306.02207.pdf

Demo 页面:https://ga642381.github.io/SpeechPrompt/speechgen.html

Code: https://github.com/ga642381/SpeechGen

引言与动机

大型语言模型(LLMs)在人工智能生成内容(AIGC)方面引起了相当大的关注,特别是随着 ChatGPT 的出现。

然而,如何用大型语言模型处理连续语音仍然是一个未解决的挑战,这一挑战阻碍了大型语言模型在语音生成方面的应用。因为语音信号包含丰富的信息,如说话者和情感,超越了纯文本数据,基于语音的语言模型 (speech language model (speech LM)) 不断涌现。

虽然与基于文本的语言模型相比,语音语言模型仍处于早期阶段,但由于语音数据中蕴含着比文本更丰富的信息,它们具备巨大的潜力,令人充满期待。

研究人员正积极探索提示 (prompt) 范式的潜力,以发挥预训练语言模型的能力。这种提示通过微调少量参数,引导预训练语言模型做特定的下游任务。这种技术因其高效和有效而在 NLP 领域备受青睐。在语音处理领域,SpeechPrompt 展示出了在参数效率方面的显著改进,并在各种语音分类任务中取得了竞争性的表现。

然而,提示能否帮助语音语言模型完成生成任务仍是未解之谜。在本文中,我们提出一个创新的统一框架:SpeechGen,旨在激发语音语言模型进行生成任务的潜力。如下图所示,将一段语音、一个特定的提示 (prompt) 喂给 speech LM 作为输入,speech LM 就能做特定的任务。比如将红色的 prompt 当作输入,speech LM 就能做 speech translation 的任务。

我们提出的框架具有以下优点:

1. 无文本 (Textless):我们的框架以及其所依赖的语音语言模型独立于文字数据,拥有无可估量的价值。毕竟,获取标记文本与语音配对的过程耗时繁琐,而且在某些语言中甚至无法找到合适的文本。无需文字的特性使得我们的强大语音生成能力得以覆盖各种语言需求,让全人类受益匪浅。

2. 多功能性 (Versatility):我们开发的框架通用性极高,能应用于各种各样的语音生成任务。论文中实验使用语音翻译、语音修复、语音连续当作例子。

3. 简易性 (Easy to follow):我们提出的框架为各类语音生成任务提供了通用解决方案,让设计下游模型和损失函数变得轻而易举。

4. 可迁移性 (Transferability):我们的框架不仅容易适应未来更先进的语音语言模型,还蕴藏着巨大的潜力,让效率和效果得到进一步提升。尤其令人振奋的是,随着先进语音语言模型即将问世,我们的框架将迎来更为强大的发展。

5. 经济性 (Affordability):我们的框架经过精心的设计,只需训练少量参数,而不是整个庞大的语言模型。这极大地减轻了计算负担,并允许在 GTX 2080 GPU 上执行训练过程。大学的实验室也能负担得起这样的运算开销。

SpeechGen介绍

我们的研究方法在于构建一个全新的框架 SpeechGen,该框架主要利用语音语言模型(Spoken Language Models, SLMs)进行各种下游语音生成任务的微调。在训练过程中,SLMs 的参数保持不变,我们的方法侧重于学习任务特定的提示(Prompt)向量。SLMs 通过同时对提示向量和输入单元进行条件设置,有效地生成特定语音生成任务所需的输出。然后,这些离散单元输出被输入到基于单元的语音合成器中,生成对应的波形。

我们的 SpeechGen 框架由三个元素组成:语音编码器、SLM 和语音解码器(Speech Decoder)。

首先,语音编码器将波形作为输入,并将其转换为由有限词汇表导出的单位序列。为了缩短序列长度,会移除重复的连续单位以生成压缩的单位序列。然后,SLM 作为单位序列的语言模型,通过预测前一单位和单位序列的后续单位来优化可能性。我们对 SLM 进行提示调整,以引导其根据任务生成适当的单位。最后,SLM 生成的标记由语音解码器处理,将其转换回波形。在我们的提示调整策略中,提示向量会在输入序列的开始处插入,这将引导 SLMs 在生成过程中的方向。具体插入的提示数量,则取决于 SLMs 的架构。在序列到序列的模型中,编码器输入和解码器输入都会加入提示,但在只有编码器或只有解码器的架构中,只会在输入序列前面添加一个提示。

在序列到序列的 SLMs(如 mBART)中,我们采用了自我监督学习模型(如 HuBERT)来处理输入和目标语音。这样做可以为输入生成离散单元,并为目标生成对应的离散单元。我们在编码器和解码器输入的前面都添加了提示向量,以构造输入序列。此外,我们还通过替换注意力机制中的关键值对,以进一步增强提示的指导能力。

在模型训练中,我们以交叉熵损失作为所有生成任务的目标函数,通过比较模型的预测结果和目标离散单元标签来计算损失。在这个过程中,提示向量是模型中唯一需要训练的参数,而 SLMs 的参数在训练过程中保持不变,这确保了模型行为的一致性。我们通过插入提示向量,引导 SLMs 从输入中提取任务特定信息,并提高产生符合特定语音生成任务的输出的可能性。这种方法允许我们微调并调整 SLMs 的行为,而无需修改其基础参数。

总的来说,我们的研究方法基于一种全新的框架 SpeechGen,通过训练提示向量,引导模型的生成过程,并使其能有效地产生符合特定语音生成任务的输出。

实验

我们的框架可以用于任意的 speech LM 及各类生成任务,具有很好的潜力。在我们的实验中,由于 VALL-E 和 AudioLM 不是开源的,我们选择使用 Unit mBART 作为 speech LM 进行案例研究。我们用语音翻译 (speech translation)、语音修复 (speech inpainting)、语音连续 (speech continuation) 当作例子,来展示我们框架的能力。这三个任务的示意图如下图所示。所有的任务都是语音输入,语音输出,无需文本帮助。

语音翻译

我们在训练语音翻译 (speech translation) 时,用的是西班牙文转英文的任务。我们给模型输入西班牙语的语音,希望模型产生英文的语音,整个过程无需文本帮助。以下是几个语音翻译的例子,我们会展示正确答案 (ground truth) 与模型的预测 (model prediction)。这些演示示例表明模型的预测捕捉到了正确答案的核心含义。

语音修补

在我们进行语音修补 (speech inpainting) 的实验中,我们特别选取超过 2.5 秒的音频片段作为后续处理的目标语音,并通过随机选择过程挑选出一段时长介于 0.8 至 1.2 秒的语音片段。然后我们对选出的片段进行掩码,模拟语音修补任务中缺失或受损的部分。我们使用词错误率 (WER) 和字符错误率 (CER) 作为评估受损片段修复程度的指标。

对 SpeechGen 生成的输出与受损语音进行比较分析,我们的模型可以显著重建口语词汇,将 WER 从 41.68% 降低到 28.61%,将 CER 从 25.10% 降低到 10.75%,如下表所示。这意味着我们提出的方法能够显著提高语音重建的能力,最终促进语音输出的准确性和可理解性。

下图是一个展示样例,上面的子图是受损的语音,下面的子图是 SpeechGen 产生的语音,可以看到,SpeechGen 很好地修复了受损的语音。

语音连续

我们将通过 LJSpeech 展示语音连续任务的实际应用。在训练提示(prompt)期间,我们的策略是让模型只看到片段的 seed segment,这个 seed segment 占据了语音总长度的部分比例,我们将其称为条件比率(condition ratio, r),并让模型继续生成后续的语音。

以下是一些实例,黑色的文字代表种子片段(seed segment),红色的文字则是 SpeechGen 生成的句子(这里的文字首先经过语音识别得到结果。在训练和推理过程中,模型完全进行的是语音到语音的任务,且完全不接收任何文字信息)。不同的条件比率使 SpeechGen 能够生成不同长度的语句以实现连贯性,并完成一句完整的话。从质量角度看,生成的句子与种子片段在语法上基本一致,并且语义相关。虽然,生成的语音仍然无法完美地传达一个完整的意思。我们预期这个问题将在未来更强大的语音模型中得到解决。

不足与未来方向

语音语言模型和语音生成正处于蓬勃发展的阶段,而我们的框架则提供了一种巧妙地利用强大语言模型进行语音生成的可能性。然而,这个框架仍有一些尚待完善之处,也有许多值得我们深入研究的问题。

1. 与基于文本的语言模型相比,语音语言模型目前还处于发展的初级阶段。虽然我们提出的提示框架能激发语音语言模型做语音生成任务,但并不能达到卓越的性能。不过,随着语音语言模型的不断进步,比如从 GSLM 到 Unit mBART 的大转身,提示的表现有了明显的提升。特别是以前对 GSLM 具有挑战性的任务,现在在 Unit mBART 下表现出更好的性能。我们预计未来会出现更多先进的语音语言模型崭露头角。

2. 超越内容信息:当前的语音语言模型并不能完全捕捉到说话者和情感信息,这给当前的语音提示框架在有效处理这些信息方面带来了挑战。为了克服这个限制,我们引入即插即用模块,专门为框架注入说话者和情感信息。展望未来,我们预计未来的语音语言模型将整合和利用这些内容之外的信息,以提高性能并更好地处理语音生成任务中的说话者和情感相关方面。

3. 提示生成的可能性:对于提示生成,我们有着灵活多变的选择,可以集成各种类型的指示,包括文本和图像指示。想象一下,我们可以训练一个神经网络,让它用图像或文本作为输入,而不是像本文中那样使用训练好的 embedding 当作提示。这个训练好的网络将成为提示生成器,为框架增添了多样性。这样的方式会让提示生成变得更加有趣、更加丰富多彩。

结论

本文我们探索了使用提示来解锁语音语言模型在各种生成任务中的性能。我们提出了一个名为 SpeechGen 的统一框架,该框架仅有约 10M 的可训练参数。我们所提出的框架具有几大特性,包括无需文本、多功能性、高效性、可转移性和可负担性。为了展示 SpeechGen 框架的能力,我们以 Unit mBART 为案例进行研究,并在三个不同的语音生成任务上进行实验:语音翻译、语音修复和语音延续。

当这篇论文提交到 arXiv 时,Google 提出了一种更先进的语音语言模型 ——SPECTRON,它为我们展示了语音语言模型在建模说话人和情感等信息的可能性。这无疑是一个令人兴奋的消息,随着先进语音语言模型的不断提出,我们的统一框架具有巨大的潜力。

idjourney Prompt 有人称之为“关键词”,其实我觉得翻译为“提示词”更确切。

了解文本内容,我们一起深度理解提示词,掌握一个真正的万能结构,从此构建属于你的“咒语”!

提示结构

首先了解下,/imagine命令的提示结构

  • Image Prompts :即“喂图”,可以将图像URL添加到提示中以影响最终结果。图片URL始终位于提示的前面。
  • Text Prompt : 文字提示词。要生成的图像的文本描述。
  • Parameters:参数。更改宽高比、模型等。参数位于提示的末尾。

文字提示词

精心编写的文字提示词,对获得我们理想图像至关重要。

Midjourney Bot 还没觉醒到,能够读取我们脑海中的意识,因此,我们需要付出足够的耐心!

完整具体

提示词不够完整具体,那么Midjourney Bot将依赖默认式样生成,可能出现我们不需要的惊喜!

假设我们只是简单提示“猫”,那么Midjourney可能给的任何猫。而我们若有需求,可以这样提示说:“两只大猫和一只小猫。”

简洁明晰

Midjourney Bot 不像人类那样理解语法、句子结构和单词。

因此,提示选择什么样的词很重要。应在简洁前提下,清晰做出描述。并且只描述我们想要什么,而不是不想要什么。

如果不想出现什么,请尝试使用--no参数。

一些例子

提示词是“三只猫(其中一只大猫和两只小猫)”,这样很容易让 Midjourney Bot 误解。

而写成:“一只大猫和两只小猫”,这样 Midjourney Bot 的理解会更准确一些。

另外,因为 Midjourney 仅支持英文的关系,小猫写成Kitten更确切,small cat 也会让 Midjourney Bot 误解。

三只猫(其中一只大猫和两只小猫)

一只大猫和两只小猫

一些要点

  • 可以使用逗号、括号和连字符来帮助我们组织想法,但 Midjourney Bot 并不会可靠的解释它们。
  • 不区分大小写,可以使用逗号、括号和连字符,但不要是{},Midjourney对{}另有含义。

知识点

所有提示,最终都会被Bot拆分成tag去理解,对符号的解释并不可靠,我们应尽量避免多义的可能,才能获得更准确的结果。

提示词万能结构

提示词万能结构:内容 + 构成 + 风格


我将此称为“CCS结构”,即内容(Content)、构成(Composition)和风格(Style)

内容、构成和风格是艺术领域创作不可缺少的三个关键要素。内容指的是艺术的主题内容,构成是元素的排列和组织方式,风格则是艺术执行的独特方式,包括技术、手法、材料、载体等。

三部分的提示词都尽量具体化提示,可以减少Bot自由发挥的空间,能更接近预期效果。

CSS结构也有助于我们整理思路,更有条理的组织,及部分提示词形成模板在利用。如保证风格和构成不变,只修改内容部分,更容易得到看似同系列的作品。

这里有一段传统艺术领域对三个要素的理解,可以给我们一些启发:

“在许多方面,内容、构成和风格是艺术的相互关联的方面。内容可以启发构成,而构成可以影响风格。同样,风格通常可以用来增强或强化艺术的内容和构成。为了创造成功的艺术作品,艺术家必须仔细考虑所有三个要素以及它们彼此之间的相互作用。如此,我们可以创造出既视觉上令人惊叹又心智上引人入胜的作品,能够预期的向观众传达复杂的思想和情感。

内容提示词的范例

主体:

A pretty young woman in a white dress 一个穿着白色裙子的漂亮年轻女人

A castle made out offlower 一座被鲜花包裹的城堡

Blacklight building 黑光效果的大楼(将颜色直接给主体定义也可以)

mascot for milk brand 乳制品的吉祥物

Tshirt vector Pikachu T恤衫矢量风格的圣斗士

环境:

indoors(室内), outdoors(户外), on the moon(月球上), in Narnia(在纳尼亚), underwater(水下), the Emerald City(翡翠城),tundra(苔原),salt flat(盐沼),jungle(丛林),desert(沙漠),mountain(山),cloud forest(云雾森林),savannah(热带草原),wetland(湿地),estuary(河口),fjord(峡湾),steppe(草原),dune(沙丘),oasis(绿洲),bay(海湾),hill(山丘),delta(三角洲),cave(洞穴),volcano(火山),waterfall(瀑布),beach(海滩),cliff(悬崖)等等,具体如on the beach at sunset(在夕阳下的海滩)这样更佳。

情绪:determined(坚定的), happy(欢乐的),sleepy(昏昏欲睡的), angry(愤怒的), shy(害羞的), embarassed(尴尬的),Sedate(稳重), calm(平静), raucous(喧闹), energetic(精力充沛)等等……

构成提示词的范例

构图:Portrait(肖像画)、headshot(头像)、half-body portrait(半身像)、closeup(特写)、Full body shot(全身照)、Three-quarter shot(三分之二侧身照)、Profile shot(侧面照)、Action shot(动作照)、Landscape shot(风景照)、Still life shot(静物照)等。

视角:Top View(俯视图)、 birds-eye view(鸟瞰图)、Horizontal angel(水平角度)、Lookup(仰视)、font view、side view(侧视图)、back view(背视图)、Perspective(透视图)、POV(摄影机视角)等。

照明:soft(柔和的), ambient(环境光), overcast(阴天的), neon(霓虹灯), studio lights(工作室灯)、in the style of soft(柔和的风格)等。

色调:vibrant(鲜艳的), muted(静柔暗淡的), bright(明亮的), monochromatic(单色的), colorful(多彩的), black and white(黑白的), pastel(淡彩的)等。

色彩:Millennial Pink(千禧粉) Acid Green(酸性绿) Desaturated(去饱和度的) Canary Yellow(淡黄色) Peach(桃红色) Two Toned(双色调) Pastel(粉彩) Mauve(淡紫色) Ebony(乌木色) Neutral(中性色) Day Glo (日格洛) Green Tinted(绿调染色),light bronze and amber(浅青铜和琥珀色)

风格提示词的范例

艺术形式(Medium):photo(照片), painting(绘画), illustration(插图), sculpture(雕塑), doodle(涂鸦), tapestry(挂毯),Block Print(版画), Folk Art(民间艺术), Cyanotype(蓝版), Graffiti(涂鸦), Paint-by-Numbers(数字画), Risograph(曲线图), Ukiyo-e(浮世绘), Pencil Sketch(铅笔素描), Watercolor(水彩画), Pixel Art(像素画), Blacklight Painting(黑光绘图), Cross Stitch(十字绣)等等。

注:艺术形式是定义风格的最佳方法之一。

技巧手法:Life Drawing(写生), Continuous Line(连续线条画), Loose Gestural(速写), Blind Contour(盲画), Value Study(明暗画法), Charcoal Sketch(炭笔素描)等等,可以对艺术形式作为补充,也可以单独使用。

年代(Decade):1700s、1700s、1800s、1900s、1910s、1920s、1930s、1940s、1950s、1960s、1970s、1980s、1990s等等,可以强化画风。

当然,风格提示词有很多,完全不局限于上述这些单词及表述形式,稍后在其他篇章,我们将继续深入用实例分析。

简单的示范

提示词如下:

A pretty young woman in a white dress,on the beach at sunset,shy, --v 5.1

一个穿白色裙子的漂亮年轻女人,在夕阳下的海滩,害羞的。

我们只提示了“内容”,没有“构成”和“风格”,所以构图、视角、照明、色彩、颜色这些都是随机的,只不过是介于我们提示了“夕阳下的海滩”,因此效果相对接近预期,色调、颜色不会偏差太大。但构图、视角这些很随机,而且有三张图是CG风格,只有图3是照片风格。必要的没有提示,Bot就自由发挥。

我们调整下提示词:

A pretty young woman in a white dress,on the beach at sunset,shy,Three-quarter shot,Lookup,soft,bright,light bronze and amber --v5.1

一个穿白色裙子的漂亮年轻女人,在夕阳下的海滩,害羞的,三分之二侧身照,仰视,柔和的,光亮的,浅青铜和琥珀色。

三分之二侧身照与仰视效果已表现。光线更柔和(与之前对比明显)。夕阳更光亮。浅青铜和琥珀色也有明显表现。而 Midjourney Bot 的智能补充结果也很棒:因为三分之二侧身照属人像,因此默认半身像,且背景虚化(人像摄影常用的大光圈景深),仰视角度配合侧身照也刚好。

我们改一个视角看看:

A pretty young woman in a white dress,on the beach at sunset,shy,Three-quarter shot,Top View,soft,bright,light bronze and amber --v 5.1

一个穿白色裙子的漂亮年轻女人,在夕阳下的海滩,害羞的,三分之二侧身照,俯视,柔和的,光亮的,浅青铜和琥珀色。

我们只调整了一个提示词,将“仰视”改为了“俯视”,对比一下吧,是不是感觉视线高了一些?

我们再尝试调整一些风格提示词:

A pretty young woman in a white dress,on the beach at sunset,shy,photo --v 5.1

一个穿白色裙子的漂亮年轻女人,在夕阳下的海滩,害羞的,照片。

为了更好的展示区别,我们去掉了构成提示部分,保持原来的内容部分,然后增加了风格提示词:照片。

可以看到,构图、角度、色调又开始自由发挥了,但是“照片”提示词已经起作用了,无论是人物、还是大海、沙滩,看不到绘画感了,每一个细节都是照片的感觉。(可以点大图看,请容易分辨,和之前对比)

我们再尝试调整一个风格:

A pretty young woman in a white dress,on the beach at sunset,shy,Ukiyo-e --v 5.1

这次从照片换成了浮世绘风格了。风格部分提示词中,艺术形式(Medium)是最影响画风,也是最方便定义风格的。

一些补充知识

除Portrait(肖像画)、headshot(头像)和closeup(特写)构图外,常用的还有:

Full body shot(全身照):指将整个人物或物体的形象呈现在画面中。

Three-quarter shot(三分之二侧身照):指将人物或物体的形象呈现在画面中,但略微侧身,呈现出画面的动态感。

Profile shot(侧面照):指将人物或物体的侧面形象呈现在画面中。

Action shot(动作照):指捕捉到人物或物体在运动或活动中的形象,以呈现出画面的动态感。

Landscape shot(风景照):指捕捉到自然风景或城市景观的形象,以呈现出画面的广阔感和气氛。

Still life shot(静物照):指呈现出静止的物体或物品的形象,通常用于绘制静物画。

常用的视角有:

Top View(俯视):是一种从正上方的视角观察物体的视图。在绘画软件中,Top View通常用于查看和编辑平面图形和二维图像。

Birds-eye View(鸟瞰):是一种从高处向下的视角观察物体的视图。在绘画软件中,Bird's-eye View通常用于查看和编辑三维场景和模型。

Horizontal Angle(水平角度):是相机或视角与地面平面之间的夹角。在绘画软件中,通过调整水平角度可以改变绘画作品中的景深和透视效果。

Lookup(仰视):是相机或视角相对于地面平面的仰角。在绘画软件中,通过调整抬头角度可以改变绘画作品中的高度感和远近感。

Front View(正视):是一种从正面的视角观察物体的视图。在绘画软件中,Front View通常用于编辑三维模型的前面部分。

Side View(侧视):是一种从侧面的视角观察物体的视图。在绘画软件中,Side View通常用于编辑三维模型的侧面部分。

Back View(背视):是一种从背面的视角观察物体的视图。在绘画软件中,Back View通常用于编辑三维模型的背面部分。

Perspective View(透视图):是一种通过透视效果来呈现物体深度和距离的视图。在绘画软件中,Perspective View通常用于编辑三维场景和模型,以便更好地模拟真实的透视效果。

POV(Point of View 摄影机视角):POV通常是指从一个特定的角度或位置观察物体或场景的视角。在AI绘画软件中,POV通常用于模拟真实世界中的摄影机视角,以便更好地呈现绘画作品。POV视角在绘画软件中非常有用,可以帮助艺术家更好地控制和编辑他们的作品。例如,艺术家可以使用POV视角来模拟不同的光照效果,调整摄影机的位置和角度,以便更好地捕捉画面中的细节和氛围。POV视角还可以用于模拟虚拟现实(VR)场景中的视角,以便更好地呈现虚拟现实体验。

一些艺术形式(Medium)的详解

Life Drawing(写生):指在现实中观察人体或物体的形象,并在纸上进行绘制的技术。Life Drawing通常被认为是绘画技巧的基础,有助于艺术家更好地掌握形态和比例等基本概念。

Continuous Line(连续线条画):指使用一条连续的线条来绘制整个画面的技术。这种技术旨在捕捉物体的形态和轮廓,具有独特的表现力和动态感。

Loose Gestural(速写):指通过快速和松散的线条来表达人物或物体的动态和姿态。这种技术通常用于表现运动、舞蹈和其他动态场景。 这种技巧也通常用于表现感性和情感化的主题,在绘画过程中强调艺术家的技能和风格。

Blind Contour(盲画):指在观察物体时将视线集中在物体上,同时不看画纸,只使用手和笔来绘制物体的轮廓和形态。这种技术旨在培养艺术家的观察能力和手眼协调能力。

Value Study(明暗画法):指通过对画面中不同区域的明暗变化进行分析和处理,以呈现出物体的形态和光影效果。这种技术通常用于绘制现实主义和写实主义作品。

Charcoal Sketch(炭笔素描):指使用炭笔在纸上进行的快速素描。这种技术通常用于表现柔和的灰调和柔和的线条效果,具有独特的表现力和质感。

本篇完。

本教程由 @加文三月 撰写,其中一部分图片和文字来自Midjourney官网资料。

本教程持续更新,请提前关注及收藏!