5分钟上手FineBI，教你如何快速分析数据，一学就

5分钟上手FineBI，教你如何快速分析数据，一学就会

ineBI：工具体验地址！

1.1 应用场景

本章介绍如何使用 Excel 制作仪表板，帮助业务人员快速上手 FineBI 。

1.2 功能简介

制作仪表板主要有三个过程：①准备数据（即上传 Excel 表），②制作仪表板，③分享仪表板。

2. 操作步骤

下载 FineBI 后先进行初始化设置，详情请参见：初始化设置

本章使用的示例数据下载链接：示例数据.rar

2.1 数据准备

1）点击「数据准备>我的自助数据集」，选择对应的业务包，如下图所示：

2）点击「添加表>添加EXCEL数据集」，如下图所示：

2）点击「上传数据」，选择需要上传的 Excel 表，如下图所示：

3）输入表名，点击「确定」，如下图所示：

完成后进行「数据更新」。

2.2 可视化分析

2.2.1 创建组件

1）进入「数据准备>我的自助数据集」分组，选择对应的业务包，选择之前上传的 Excel 数据集，点击创建组件，如下图所示：

2）跳出创建组件框，可以为该仪表板输入仪表板名，并选择仪表板保存的位置，如下图所示：

3）点击确定，自动跳转到组件编辑界面，此时可以对 Excel 表进行可视化操作。如下图所示：

2.2.2 编辑组件

FineBI 可以进行多种可视化分析，展示各种图表，以下以柱形图为例进行介绍。

1）将维度「合同类型」拖入横轴，指标「购买数量」拖入纵轴，选择图表类型为「多系列柱形图」，如下图所示：

2）若是需要在柱形图上显示标签，将左侧「购买数量」拖入标签，如下图所示：

2.2.2 排序

若要对其进行排序，可选择「合同类型」下拉，「降序>购买数量」，则横轴的「合同类型」按「购买数量」大小降序排列。

2.2.3 过滤

1）若是图表仅需要展示「服务协议」和「购买合同」，可以点击合同类型下拉>过滤，如下图所示：

2）点击「添加条件」，选择过滤字段为「合同类型」，如下图所示：

3）点击「确定」，可以看到柱形图如下图所示：

2.2.3 预览仪表板

点击「进入仪表板>预览仪表板」，即可进入仪表板预览界面，如下图所示：

注：在预览仪表板界面，点击右上角的编辑仪表板，即可进入仪表板编辑界面，先仪表板编辑界面才能进入组件编辑界面。

2.3 分享仪表板

注：只有部署后的 FineBI 才可以分享仪表板。

仪表板完成制作后，保存在「仪表板」节点下，可以创建公共链接分享仪表板。

1）鼠标触碰要分享的仪表板，选择创建公共链接的按钮，如下图所示：

2）系统自动跳出链接分享页面，开启按钮，并点击「复制链接」，如下图所示：

3）分享之前复制的链接，别人就可以查看该仪表板。

3. 学习成果检验

这边布置了一个线上作业，希望大家学完后，可以做下这套试卷，检验下自己的学习成果，查缺补漏：基础入门习题01

对信息科技飞速发展的现状，网络已成为人们取得信息资讯的重要途径之一。由于信息过载现象愈发严重，文章采集源码因其高效搜集网络资料的特性而备受关注。本刊将以理论与实践相结合的方式，深入探讨文章采集源码的运作原理及应用范围，以便读者更为全面深刻地理解这一技术概念。

一、文章采集源码的概念

本文论述了通过编写程序抓取网页源代码获取互联网信息的方法。此策略可高效收集海量信息，涵盖文字、图片和视频等各类媒体形式，后续将支持数据分析和实际运用。然而，实施此类技术需要熟练掌握网络请求处理、HTML解析与数据提取等技巧，通常由具备丰富编程经验且熟知网络通信协议的程序员进行操作。

实用层面上，文章采集源码已成为了搜索引擎技术、数据挖掘、舆论分析和竞品深度评估等诸多领域的核心工具。它强大的功能包括从网络上广泛搜集各种信息，助力企业洞悉市场脉动、把握消费者需求，甚至优化生产过程。此外，它还在学术科研和文献检索领域发挥着举足轻重的角色。由此可见，文章采集源码在当前社会环境下的重要性及其未来的巨大发展潜力是显而易见的。

二、文章采集源码的技术原理

文章采集源码的实现涉及到多种技术，主要包括以下几个方面：

网络请求：采用HTTP协议，通过请求采集器从特定网站获取所需的HTML文档内容。在实践中，Python中的请求库及Java里的HttpClient都能有效模拟浏览器行为，与目标网站进行协作通信。

网页源码解析：当获取到网页源码后，需进行解析，从而获取所需关键信息。常用的HTML解析工具有BeautifulSoup和Jsoup等，它们能帮助开发人员快速定位所需数据区，完成提取和清洗工作。

数据抓取：借助HTML源代码分析技术，精准提取所需数据。该过程可能采用正则表达式、XPath或CSS选择器等工具，根据网页布局结构实现数据精确定位和抽取。

数据存储：待取数完毕后，即进入存储与管理阶段。依据分析运用的需求，选择将数据保存至相应的文件，数据库或内存中，以便于深度分析和实际应用。

源代码采集技术的本质涉及多个领域，如网络通信、HTML解析和数据抓取及存储等。为了高效运用此项技术，开发人员需熟练掌握各类相关技术。

三、文章采集源码的应用场景

文本搜集源代码是各行各业普遍采用的网络信息获取利器，应用领域广泛。

搜索引擎利用互联网收录各种类型信息，构建索引体系，致力于向使用者提供高效准确的检索服务。文章采集代码可以辅助搜索引擎收集与整合诸如新闻、博客、论坛等各类网站内容。

数据挖掘：此项技术旨在解析巨量数据以揭示潜在规则和模式，从而为企业制定决策提供可靠的支持。原文包含的源码，有利于促进数据挖掘工程师高效收集并处理网络数据，顺利完成特征抽取以及模式识别等复杂工作。

舆情监控至关重要，政府及企事业单位须关注公众舆论瞬息万变的趋势，以便适时调整战略方针。文章采集源码可作为辅助工具，用于舆情监控系统，准确获取网络上消费者言论、新闻报道等讯息，为深入的舆情分析提供数据支撑，并发出预警提示。

竞品研究：企业需深度掌握竞品特性及市场趋势，以此制定有力的竞争策略。文章所提供之源代码将协助企业收集并分析竞品信息，从而为决策过程提供有力支持。

本方案运用先进的文章采集源代码，以全网实时采集为核心手段，全方位精确满足各种应用需求，为决策者提供高质量的数据参考和支持。

四、文章采集源码的实践经验

本篇文章从实践角度深入剖析，对于编写文章采集源代码所需具备的核心技术能力及其实操经验做出详尽阐述。

为了确保文章采集与编辑工作的顺利进行，选择恰当的工具尤为关键。根据实际需求，我们能够运用Python这类具有高度灵活性和强大网络爬虫库的编程语言来满足源代码的构建需求，例如Scrapy和BeautifulSoup皆是其中的佼佼者。

重视反爬虫策略：部分站点实施严格的反爬虫机制，以此遏制网络爬虫。为适应此类限制，开发人员需采取相应措施，例如设置恰当的请求头部信息及使用代理IP等技术手段。

针对特殊情况，传统电子商务爬虫框架难以适应真实要求，为此我们可以提供专属解决方案。依据具体情境，我们的专业工程师将为您量身定做符合实际需求的爬虫程序，全面提高数据采集的可靠性和高效性。

依循法律法规：网络文章资源码的采集需严格依照法律法规要求，尊重并遵守各网站所制定的「机器人协议」，确保不侵害他人的合法权益。

总之，必须选用具备实战经验的程序员执行源码采集任务，并严格遵循相关法律与伦理规范。

五、总结与展望

通过运用文章采集源码技术，我们能够快速获取大量网络资讯，具有显著实用性和广阔适用价值。本文旨在解析文章采集源码的基础知识、技术原理、实际应用以及实践操作经验，帮助你更为系统、深入地理解和运用这项技术，从而能在各行业数据分析以及决策制定上提供强大助力。

伴随着互联网的广泛运用和影响力的提升，文章采集源码技术正逐步走向完备并得以普遍推广。这不仅极大地方便了人们的日常生活和工作，也为未来带来了无尽可能性。然而，我们亦需面对此过程中出现的潜在风险，诸如隐私泄露和信息安全等问题，以期能共同推进科技发展与社会和谐进步。

本文旨在深入分析文章采集源代码并提供实践操作指导。诚邀各位分享宝贵见解和经验，携手推动相关领域发展。

职阅文有一年多了，开始接手阅文作家端的业务，这篇文章断断续续进行了一个月才写完，全是自己的总结，欢迎同行来交流～

一、桌面端写作工具的优势

从移动端的 “一维” 到桌面端的 “二维” 布局，将移动端的多级界面扁平化，降低了信息架构的深度，单页面信息承载量更大。

1、相比 APP/WEB，桌面端的优势：

稳定的操作环境，适合长时间使用
更大操作区域，更快调取各类功能
更强的性能环境，能更快速响应复杂操作

2、产品设计挑战：

用户更多的定制化功能诉求
工具型产品用户快速上手的能力
多端使用场景的切换，在线/本地文档储存的机制

二、设计分析

以 通用类 “ 应用布局 / 层级 / 导航 / 对话方式 ” 及 特有的 “ 创作输入 / 创作辅助 ” ，6个维度展开分析

1、应用布局

聚合类：聚合多种文件格式（word/ppt/excle等），多栏纵向结构便于查找，且管理功能较多，也需以列表形式罗列左侧。

垂直类（我们）：主打文字写作，因此强引导建书 / 连载，多书同时编辑诉求较低，内容区域应以单书占页面主导，且管理功能少，可固定顶部；

2、应用层级

2.1、内嵌窗口 —— 大多数情况适用

内嵌窗口有利于多任务对照并行符合写作产品特性 ，是桌面端相较其他端最大的优势

如「WPS」设置文本样式功能，以右侧窗口承载，查看生成后的效果和查看选项可对照进行

2.2、新建窗口 —— 适用于进程间有较多数据交互的情况

技术上为Webview调度，可让各进程独立请求数据，无需考虑多个写作页面间数据同步的问题，适用于换肤 / 拼字等需通知其他页面进程的功能

「橙瓜」将工作台与写作台分开，拼字等其他延展功能均在工作台实现，规避了复杂功能与写书的数据交互，数据互相独立请求

3、应用导航

写作产品根据产品架构需要，分别有 选项卡、主页导航、书籍目录

3.1、选项卡

网页/聚合文档对于新建和切换的诉求强，因此选项卡承载较多功能（常驻新建/右侧固定常用功能）

写作型产品聚焦单书创作，因此无需常驻添加（建书）按钮，下图作家助手优于「橙瓜」

3.2、主页导航

分为 组合导航 / 顶部导航 / 侧边导航，写作工具功能数量少且稳定，可让出更多横向空间展示单书信息，组合导航为最优选择

3.3、书籍目录

区别于主页导航，书籍目录程树状结构，导航不可编辑，目录可编辑

目录类型分为 仅标题/ 标题 + 正文 + 时间 / 窗格类，写作工具为第一种

读者关注 VS 作者关注，两者目录结构一致，但关注点不同，作者在后台对目录编辑，然后呈现于用户

同时，平台也需要关注读者视角下的展示效果，极端情况给予提示，或提供读者视角预览能力

在不用的时候，目录需折叠，为码字区域让出更多空间，但又需了解当前编辑/浏览位置，「飞书」提供了用横线作为锚点方式，既不打扰又可知当前坐标；「 WPS」导入书籍后根据段落格式自动生成目录；「ulysses」可对某一章节设定字数目标，未达目标给予提示，与以往的设定全文目标字数不同

4、对话方式

可分为 气泡 / 抽屉 / 弹窗 / 页面 ，其信息量与干扰性各异，需根据内容性质（ 对照 / 警示 / 编辑任务 / 展示）选择使用

4.1、气泡

用于告诉用户“这是什么”，出现位置和触发它的元素具有非常紧密的位置关系，多用于首次下载时粗颗粒度介绍产品功能

但用户使用工具型产品是循序渐进的，不仅需要用气泡告诉用户“这是什么”，还需有常驻入口供随时查看，即下图类型3固定入口，告诉用户“怎么用”

如何告诉用户“怎么用”，总结为下图4类方式，“文档/通知/与帮助中心结合/与写作课堂结合”，以是否支持用户在主场景快速回溯并对照使用来评判方式优劣，因此下图1和3较优

4.2、抽屉

抽屉从页面的右侧展开，覆盖在原页面之上，不占用画布的实际显示区域，能满足 与主进程对照使用 的需求

抽屉最大的优点在于有充足的纵向空间，适合用于大纲、帮助中心此类对纵向空间要求较高的功能

抽屉在视频软件制作类工具会从底部展开，用于横向拖动帧，视频窗口支持缩小不影响主编辑进程，符合其产品特性

底部抽屉在写作工具上则需慎用，会遮挡文本编辑窗口，影响主编辑进程

4.3、对话框

对话框应用场景分为 确认类、展示类、任务类 三种

4.3.1、确认类

用于二次询问，承载较为紧急的信息，进入下一环节前用户必须做出选择。如：用户未保存或提交前文件有误，必须由系统用对话框二次询问用户。

4.3.2、展示类

常用于展示规则告知，文本溢出伴随滚动条

4.3.3、任务类

常用于自定义设置，对话框内可能包含输入框/复选项/单选项，多见于作品管理，与“4.4页面”定义模糊，两者均可使用。

*对话框常与抽屉混淆使用，可根据下图对业务场景做判断

4.4、页面

非模态（nonmodal/modeless），不会阻断用户的操作，用户可以继续之前的交互操作，不对其进行回应。

桌面端多进程优势下，新开页面与上一级可以没有关联，窗体支持拖动，支持手动拉伸，且窗体之上还可覆盖对话框，如下图大神码字用页面承载大纲，关闭页面时弹出对话框确认修改内容。

其与移动端底部弹出的页面类似，用户可以点击页面之外的其他位置关闭。

5、创作输入

键盘输入的形式，组合快捷键+双手拼字，段落式文本为主，速度快，文本容错很重要；

窗体大且需适配多任务，鼠标选择范围大，视觉动线随着光标移动，为达沉浸，热区容错及坐标稳定很重要

右键编辑热区范围无需局限文本，快速大批量输入后支持一键纠错

横向跟随任务变化稳定居中，纵向光标坐标随着文本量增加趋于稳定，避免贴底

6、创作辅助

6.1、工具栏

工具用于辅助写作，以聚合的方式出现在一起，形成工具栏，其位置可固定顶部或就近出现，分组以自定义 / 一键操作区分

工具位置：固定顶部为常用做法，但跟随文本就近出现让视觉动线更稳定，可组织部分常用工具放此处，如下图所示，工具在选中文本时才出现，改写内容对比跟随其后，且支持一键粘贴，视线无需离开编辑区域，就近即可完成多件事

工具类型：分为 自定义类 与 一键操作类，自定义类涵盖多个选项（默认/其他X个），需外露默认项，因此需用下拉菜单承载；一键操作类1个选项开启/关闭，除基础选项（加粗/下划线等），也应对一系列相关的功能组合成最优值，帮助用户一键达到目标效果。如，一键排版，设置内容包含删除空格、段落首行缩进等。当用户需求较为简单时，只需设置一次即可达到目标效果，而无需设置多次。

工具需基于用户的主要行为路径组织，常用的固定展示并分组，高级或不常用的隐藏，用户对产品功能有着相对固定的使用习惯，需支持自定义，减少重复性的操作，组织方式总共分为以下三步骤

分组：「橙瓜」有下拉选项的字体设置用色块，其余用icon，icon间类型不同的留白隔开，「WPS」的混合排布，腾讯文档有分组但不利用色块区分，「橙瓜」的工具选择的决策时间更短

隐藏：「飞书」 省去了顶部工具栏，浮动代替固定展示，即编辑器内有文本且选中文本时才出现，如无必要不增实体

自定义：支持用户主动隐藏少用/展示常用工具，支持自定义惯用快捷键组合方式

6.2、输入状态显示

自上而下的输入，视觉动线恒定在页面中下方，因此在底部展示当前输入状态最为合适，信息及功能类型大多沿袭老牌Office办公软件，理解门槛低。

6.3、内容安全保障

对于写作工具来说，内容安全为生命线，是沉浸体验的基础，创作节点需被保存（自动/手动），保存则形成数据历史，数据历史需具备兜底能力（历史版本查看/恢复）

6.3.1 自动保存

一般可手动设置保存间隔，除认知减负外，数据保障效果也最好，间隔范围可以是几秒钟，几分钟甚至几小时，这里需要根据性能损耗定夺，过于频繁的存档性能损耗也会造成数据丢失，并非间隔越短越好

CTRL+Z撤回也是自动保存的一部分，输入是个反复的过程，AI写作工具「秘塔写作猫」在加载过程反复提示CTRL+Z可撤销文本，告知用户与普通文档没有什么区别，安全感十足

省去了手动保存成本的同时，需在显眼位置提示用户保存结果，对自动保存产生信任，如下图编辑器外文档列表的提示，编辑器内显眼处的提示

若用户进行危险操作，如关闭存档功能，应如下图WPS做??警示和免责声明

若网络异常无法在线备份，应如下图引导刷新的同时，支持手动备份

6.3.2 主动保存

部分在线工具会提供 二次保存按钮按钮或快捷键(Ctrl+S) 供用户二次确认，相比机器人们更相信自己，「橙瓜」除了持续提示文档系统已帮用户保存，也会在目录上方提供同步按钮供用户点击。

历史版本查看/恢复需以下图右侧目录形式展示，回退某个节点这件事本身也需形成一个新的点

为避免误操作，下图「飞书」查看历史版本需进入编辑状态，操作结果可以编辑状态下的“确认还原“为准，未确认的不作数

本地数据需考虑更换设备的情况，如「QQ音乐」会在Wi-Fi环境备份设备已下载歌曲，更换设备后，同账号下，支持下载“历史“本地歌曲，可单条下载也可一键下载，关注换机用户数据同步的痛点

桌面端写作工具行业趋势

由人辅助机器（根据用户习惯决定功能）转向机器辅助人（功能主动帮助用户），即Ai生成式文本创作，基于不同程度的算法能力，为不同创作阶段提供 “智能改写 / 智能续写 / 智能检索 / 一键排版 / 图片识字”

1、智能改写

改写主要发力于错字错词/标点/语序/语法/敏感词等算力成本低的类型上，目前在主流写作工具如「橙瓜」等已广泛运用，

下图「秘塔写作猫」将改写统计至右侧，清晰明确（包括哪些需付费），纠错较为准确，免费功能即可满足纠正低级错误，网络词汇等高级词汇提示需利用更加复杂的算力，为付费功能

2、智能续写

目前的AI写作技术还不足以支撑完整的AI生成故事，国内的部分AI写作平台可根据上下文按句续写/按段续写，剧情走向用户可选，弥补了AI生成故事完整性欠缺的问题

如下图的按句续写，以“声音又响起来”为节点，往后均为AI通过上下文的理解按句输出，右侧为生成的池子，选择某句想要的进行填充，根据单句AI再推理下一句，剧情走向在用户控制范围内，合理通顺

按段续写则如下图，「火龙果」支持理解上下文中的人物名称，根据主谓宾填充至生成的文本中，剧情走向选择多，且叙述逻辑也较为合理

下图「腾讯effidit」，续写段落，还额外提供了文中个别语义相关的网络素材

国外AI续写主流产品为「NovelAI」，其续写能力仅支持连续写作，剧情走向较不可控，逻辑不通顺，较大的改写成本

*黄色字为用户输入的开头，白色字为生成部分

*翻译后

3、智能检索

根据选中的文本，利用爬虫技术查询全网可能匹配的素材，素材内容可为“文章/词义解释/图片等”

文章类比如下图「Get写作」平台，选择文本点击右键，选择需查找的素材，即可在编辑器左侧展开素材结果，并引用/收藏/查看更多

「火龙果」则提供资料库支持本地参考

词义解释类如下图「秘塔写作猫」平台，支持查询词义解释

图片素材类

，可选中关联文本进行图片搜索，图片结果出现在编辑器右侧，支持长按拖动右侧图片嵌入文本区域

4. 智能排版

功能组合（空行+缩进+删除多余字符等），利用AI将排版参数调整至最优

5.图片识字

通常以插件的形式依附于网页/app/办公软件，支持框选图片识别文本，也支持抓取网页可识别的text文本一键复制

浏览网页时，遇到可借鉴但无法复制的文本，打开插件选择文字识别，框选图片区域即可生成文本

在线咨询

上一篇：VBA爬虫轻松搞定网页数据提取
下一篇：CSS 图片间隙问题解决

您的项目需求

*请认真填写需求信息，我们会在24小时内与您取得联系。

整合营销服务商