整合营销服务商

电脑端+手机端+微信端=数据同步管理

免费咨询热线:

Java使用aspose删除pdf中不需要的图片

Java使用aspose删除pdf中不需要的图片

spose是什么

Aspose于2002年3月在澳大利亚悉尼创建,旗下产品覆盖文档、图表、PDF、条码、OCR、CAD、HTML、电子邮件等各个文档管理领域,为全球.NET 、Java、C ++等10余种平台开发人员提供丰富的开发选择。

Aspose.PDF for java

此链接「链接」是官方的Aspose.PDF for Java文档,包含了非常全的Java API使用示例,可以作为操作PDF的一手资料。

Aspose.PDF for Java

Aspose.PDF 操作图片

    public static void processImages(String filePath) {
        Document document=new Document(filePath);
        for (int i=1; i <=document.getPages().size(); i++) {
            Page page=document.getPages().get_Item(i);
            for (int j=1; j <=page.getResources().getImages().size(); j++) {
                XImage image=page.getResources().getImages().get_Item(j);
                System.out.println(image);
                // delete by image features
                if (image.getWidth()==302 && image.getHeight()==95) {
                    System.out.println("delete ad image");
                    image.delete();
                }
            }
        }
        document.save(filePath.replace(".pdf", System.currentTimeMillis() + ".pdf"));
    }

代码解析:

  1. 将文档解析为document对象 Document |Aspose.PDF for Java API Reference
  2. 从document拿到page对象 Page |Aspose.PDF for Java API Reference
  3. 从page拿到resource,最终拿到XImage XImage |Aspose.PDF for Java API Reference
  4. 通过XImage去操作,删除图片

较七个在 Python 中绘图的库和 API,看看哪个最能满足你的需求。

  • 来源:https://linux.cn/article-12327-1.html
  • 作者:Shaun Taylor-morgan
  • 译者:Xingyu.Wang

(本文字数:8312,阅读时长大约:9 分钟)

比较七个在 Python 中绘图的库和 API,看看哪个最能满足你的需求。

“如何在 Python 中绘图?”曾经这个问题有一个简单的答案:Matplotlib 是唯一的办法。如今,Python 作为数据科学的语言,有着更多的选择。你应该用什么呢?

本指南将帮助你决定。

它将向你展示如何使用四个最流行的 Python 绘图库:Matplotlib、Seaborn、Plotly 和 Bokeh,再加上两个值得考虑的优秀的后起之秀:Altair,拥有丰富的 API;Pygal,拥有漂亮的 SVG 输出。我还会看看 Pandas 提供的非常方便的绘图 API。

对于每一个库,我都包含了源代码片段,以及一个使用 Anvil 的完整的基于 Web 的例子。Anvil 是我们的平台,除了 Python 之外,什么都不用做就可以构建网络应用。让我们一起来看看。

示例绘图

每个库都采取了稍微不同的方法来绘制数据。为了比较它们,我将用每个库绘制同样的图,并给你展示源代码。对于示例数据,我选择了这张 1966 年以来英国大选结果的分组柱状图。

Bar chart of British election data

我从维基百科上整理了 英国选举史的数据集 :从 1966 年到 2019 年,保守党、工党和自由党(广义)在每次选举中赢得的英国议会席位数,加上“其他”赢得的席位数。你可以 以 CSV 文件格式下载它 。

Matplotlib

Matplotlib 是最古老的 Python 绘图库,现在仍然是最流行的。它创建于 2003 年,是 SciPy Stack 的一部分,SciPy Stack 是一个类似于 Matlab 的开源科学计算库。

Matplotlib 为你提供了对绘制的精确控制。例如,你可以在你的条形图中定义每个条形图的单独的 X 位置。下面是绘制这个图表的代码(你可以在 这里 运行):

    import matplotlib.pyplot as plt
    import numpy as np
    from votes import wide as df

    # Initialise a figure. subplots() with no args gives one plot.
    fig, ax=plt.subplots()

    # A little data preparation
    years=df['year']
    x=np.arange(len(years))

    # Plot each bar plot. Note: manually calculating the 'dodges' of the bars
    ax.bar(x - 3*width/2, df['conservative'], width, label='Conservative', color='#0343df')
    ax.bar(x - width/2, df['labour'], width, label='Labour', color='#e50000')
    ax.bar(x + width/2, df['liberal'], width, label='Liberal', color='#ffff14')
    ax.bar(x + 3*width/2, df['others'], width, label='Others', color='#929591')

    # Customise some display properties
    ax.set_ylabel('Seats')
    ax.set_title('UK election results')
    ax.set_xticks(x)    # This ensures we have one tick per year, otherwise we get fewer
    ax.set_xticklabels(years.astype(str).values, rotation='vertical')
    ax.legend()

    # Ask Matplotlib to show the plot
    plt.show()

这是用 Matplotlib 绘制的选举结果:

Matplotlib plot of British election data

Seaborn

Seaborn 是 Matplotlib 之上的一个抽象层;它提供了一个非常整洁的界面,让你可以非常容易地制作出各种类型的有用绘图。

不过,它并没有在能力上有所妥协!Seaborn 提供了访问底层 Matplotlib 对象的 逃生舱口 ,所以你仍然可以进行完全控制。

Seaborn 的代码比原始的 Matplotlib 更简单(可在 此处 运行):

    import seaborn as sns
    from votes import long as df

    # Some boilerplate to initialise things
    sns.set()
    plt.figure()

    # This is where the actual plot gets made
    ax=sns.barplot(data=df, x="year", y="seats", hue="party", palette=['blue', 'red', 'yellow', 'grey'], saturation=0.6)

    # Customise some display properties
    ax.set_title('UK election results')
    ax.grid(color='#cccccc')
    ax.set_ylabel('Seats')
    ax.set_xlabel(None)
    ax.set_xticklabels(df["year"].unique().astype(str), rotation='vertical')

    # Ask Matplotlib to show it
    plt.show()

并生成这样的图表:

Seaborn plot of British election data

Plotly

Plotly 是一个绘图生态系统,它包括一个 Python 绘图库。它有三个不同的接口:

  1. 一个面向对象的接口。
  2. 一个命令式接口,允许你使用类似 JSON 的数据结构来指定你的绘图。
  3. 类似于 Seaborn 的高级接口,称为 Plotly Express。

Plotly 绘图被设计成嵌入到 Web 应用程序中。Plotly 的核心其实是一个 JavaScript 库!它使用 D3 和 stack.gl 来绘制图表。

你可以通过向该 JavaScript 库传递 JSON 来构建其他语言的 Plotly 库。官方的 Python 和 R 库就是这样做的。在 Anvil,我们将 Python Plotly API 移植到了 Web 浏览器中运行 。

这是使用 Plotly 的源代码(你可以在这里 运行 ):

    import plotly.graph_objects as go
    from votes import wide as df

    #  Get a convenient list of x-values
    years=df['year']
    x=list(range(len(years)))

    # Specify the plots
    bar_plots=[
        go.Bar(x=x, y=df['conservative'], name='Conservative', marker=go.bar.Marker(color='#0343df')),
        go.Bar(x=x, y=df['labour'], name='Labour', marker=go.bar.Marker(color='#e50000')),
        go.Bar(x=x, y=df['liberal'], name='Liberal', marker=go.bar.Marker(color='#ffff14')),
        go.Bar(x=x, y=df['others'], name='Others', marker=go.bar.Marker(color='#929591')),
    ]

    # Customise some display properties
    layout=go.Layout(
        title=go.layout.Title(text="Election results", x=0.5),
        yaxis_title="Seats",
        xaxis_tickmode="array",
        xaxis_tickvals=list(range(27)),
        xaxis_ticktext=tuple(df['year'].values),
    )

    # Make the multi-bar plot
    fig=go.Figure(data=bar_plots, layout=layout)

    # Tell Plotly to render it
    fig.show()

选举结果图表:

Plotly plot of British election data

Bokeh

Bokeh (发音为 “BOE-kay”)擅长构建交互式绘图,所以这个标准的例子并没有将其展现其最好的一面。和 Plotly 一样,Bokeh 的绘图也是为了嵌入到 Web 应用中,它以 HTML 文件的形式输出绘图。

下面是使用 Bokeh 的代码(你可以在 这里 运行):

    from bokeh.io import show, output_file
    from bokeh.models import ColumnDataSource, FactorRange, HoverTool
    from bokeh.plotting import figure
    from bokeh.transform import factor_cmap
    from votes import long as df

    # Specify a file to write the plot to
    output_file("elections.html")

    # Tuples of groups (year, party)
    x=[(str(r[1]['year']), r[1]['party']) for r in df.iterrows()]
    y=df['seats']

    # Bokeh wraps your data in its own objects to support interactivity
    source=ColumnDataSource(data=dict(x=x, y=y))

    # Create a colourmap
    cmap={
        'Conservative': '#0343df',
        'Labour': '#e50000',
        'Liberal': '#ffff14',
        'Others': '#929591',
    }
    fill_color=factor_cmap('x', palette=list(cmap.values()), factors=list(cmap.keys()), start=1, end=2)

    # Make the plot
    p=figure(x_range=FactorRange(*x), width=1200, title="Election results")
    p.vbar(x='x', top='y', width=0.9, source=source, fill_color=fill_color, line_color=fill_color)

    # Customise some display properties
    p.y_range.start=0
    p.x_range.range_padding=0.1
    p.yaxis.axis_label='Seats'
    p.xaxis.major_label_orientation=1
    p.xgrid.grid_line_color=None

图表如下:

Bokeh plot of British election data

Altair

Altair 是基于一种名为 Vega 的声明式绘图语言(或“可视化语法”)。这意味着它具有经过深思熟虑的 API,可以很好地扩展复杂的绘图,使你不至于在嵌套循环的地狱中迷失方向。

与 Bokeh 一样,Altair 将其图形输出为 HTML 文件。这是代码(你可以在 这里 运行):

    import altair as alt
    from votes import long as df

    # Set up the colourmap
    cmap={
        'Conservative': '#0343df',
        'Labour': '#e50000',
        'Liberal': '#ffff14',
        'Others': '#929591',
    }

    # Cast years to strings
    df['year']=df['year'].astype(str)

    # Here's where we make the plot
    chart=alt.Chart(df).mark_bar().encode(
        x=alt.X('party', title=None),
        y='seats',
        column=alt.Column('year', sort=list(df['year']), title=None),
        color=alt.Color('party', scale=alt.Scale(domain=list(cmap.keys()), range=list(cmap.values())))
    )

    # Save it as an HTML file.
    chart.save('altair-elections.html')

结果图表:

Altair plot of British election data

Pygal

Pygal 专注于视觉外观。它默认生成 SVG 图,所以你可以无限放大它们或打印出来,而不会被像素化。Pygal 绘图还内置了一些很好的交互性功能,如果你想在 Web 应用中嵌入绘图,Pygal 是另一个被低估了的候选者。

代码是这样的(你可以在 这里 运行它):

    import pygal
    from pygal.style import Style
    from votes import wide as df

    # Define the style
    custom_style=Style(
        colors=('#0343df', '#e50000', '#ffff14', '#929591')
        font_family='Roboto,Helvetica,Arial,sans-serif',
        background='transparent',
        label_font_size=14,
    )

    # Set up the bar plot, ready for data
    c=pygal.Bar(
        title="UK Election Results",
        style=custom_style,
        y_title='Seats',
        width=1200,
        x_label_rotation=270,
    )

    # Add four data sets to the bar plot
    c.add('Conservative', df['conservative'])
    c.add('Labour', df['labour'])
    c.add('Liberal', df['liberal'])
    c.add('Others', df['others'])

    # Define the X-labels
    c.x_labels=df['year']

    # Write this to an SVG file
    c.render_to_file('pygal.svg')

绘制结果:

Pygal plot of British election data

Pandas

Pandas 是 Python 的一个极其流行的数据科学库。它允许你做各种可扩展的数据处理,但它也有一个方便的绘图 API。因为它直接在数据帧上操作,所以 Pandas 的例子是本文中最简洁的代码片段,甚至比 Seaborn 的代码还要短!

Pandas API 是 Matplotlib 的一个封装器,所以你也可以使用底层的 Matplotlib API 来对你的绘图进行精细的控制。

这是 Pandas 中的选举结果图表。代码精美简洁!

    from matplotlib.colors import ListedColormap
    from votes import wide as df

    cmap=ListedColormap(['#0343df', '#e50000', '#ffff14', '#929591'])

    ax=df.plot.bar(x='year', colormap=cmap)

    ax.set_xlabel(None)
    ax.set_ylabel('Seats')
    ax.set_title('UK election results')

    plt.show()

绘图结果:

Pandas plot of British election data

要运行这个例子,请看 这里 。

以你的方式绘制

Python 提供了许多绘制数据的方法,无需太多的代码。虽然你可以通过这些方法快速开始创建你的绘图,但它们确实需要一些本地配置。如果需要, Anvil 为 Python 开发提供了精美的 Web 体验。祝你绘制愉快!


via: https://opensource.com/article/20/4/plot-data-python

作者: Shaun Taylor-Morgan 译者: wxy 校对: wxy

本文由 LCTT 原创编译, Linux中国 荣誉推出

点击“了解更多”可访问文内链接

译自: https://opensource.com/article/18/9/open-source-javascript-chart-libraries

作者: Dr.michael J.garbade

译者: 周家未

图表及其它可视化方式让传递数据的信息变得更简单。

对于数据可视化和制作精美网站来说,图表和图形很重要。视觉上的展示让分析大块数据及传递信息变得更简单。JavaScript 图表库能让数据以极好的、易于理解的和交互的方式进行可视化,还能够优化你的网站设计。

本文会带你学习最好的 3 个开源 JavaScript 图表库。

1、 Chart.js

Chart.js 是一个开源的 JavaScript 库,你可以在自己的应用中用它创建生动美丽和交互式的图表。使用它需要遵循 MIT 协议。

使用 Chart.js,你可以创建各种各样令人印象深刻的图表和图形,包括条形图、折线图、范围图、线性标度和散点图。它可以响应各种设备,使用 HTML5 Canvas 元素进行绘制。

示例代码如下,它使用该库绘制了一个条形图。本例中我们使用 Chart.js 的内容分发网络(CDN)来包含这个库。注意这里使用的数据仅用于展示。

<!DOCTYPE html>

<html>

<head>

<script src="https://cdnjs.cloudflare.com/ajax/libs/Chart.js/2.5.0/Chart.min.js"></script>

</head>

<body>

<canvas id="bar-chart" width=300" height="150"></canvas>

<script>

new Chart(document.getElementById("bar-chart"), {

type: 'bar',

data: {

labels: ["North America", "Latin America", "Europe", "Asia", "Africa"],

datasets: [

{

label: "Number of developers (millions)",

backgroundColor: ["red", "blue","yellow","green","pink"],

data: [7,4,6,9,3]

}

]

},

options: {

legend: { display: false },

title: {

display: true,

text: 'Number of Developers in Every Continent'

},

scales: {

yAxes: [{

ticks: {

beginAtZero:true

}

}]

}

}

});

</script>

</body>

</html>

如你所见,通过设置 type 和 bar 来构造条形图。你可以把条形体的方向改成其他类型 —— 比如把 type 设置成 horizontalBar。

在 backgroundColor 数组参数中提供颜色类型,就可以设置条形图的颜色。

颜色被分配给关联数组中相同索引的标签和数据。例如,第二个标签 “Latin American”,颜色会是 “蓝色(blue)”(第二个颜色),数值是 4(data 中的第二个数字)。

代码的执行结果如下。



2、 Chartist.js

Chartist.js 是一个简单的 JavaScript 动画库,你能够自制美丽的响应式图表,或者进行其他创作。使用它需要遵循 WTFPL 或者 MIT 协议。

这个库是由一些对现有图表工具不满的开发者进行开发的,它可以为设计师或程序员提供美妙的功能。

在项目中包含 Chartist.js 库后,你可以使用它们来创建各式各样的图表,包括动画,条形图和折线图。它使用 SVG 来动态渲染图表。

这里是使用该库绘制一个饼图的例子。

<!DOCTYPE html>

<html>

<head>

<link href="https//cdn.jsdelivr.net/chartist.js/latest/chartist.min.css" rel="stylesheet" type="text/css" />

<style>

.ct-series-a .ct-slice-pie {

fill: hsl(100, 20%, 50%); /* filling pie slices */

stroke: white; /*giving pie slices outline */

stroke-width: 5px; /* outline width */

}

.ct-series-b .ct-slice-pie {

fill: hsl(10, 40%, 60%);

stroke: white;

stroke-width: 5px;

}

.ct-series-c .ct-slice-pie {

fill: hsl(120, 30%, 80%);

stroke: white;

stroke-width: 5px;

}

.ct-series-d .ct-slice-pie {

fill: hsl(90, 70%, 30%);

stroke: white;

stroke-width: 5px;

}

.ct-series-e .ct-slice-pie {

fill: hsl(60, 140%, 20%);

stroke: white;

stroke-width: 5px;

}

</style>

</head>

<body>

<div class="ct-chart ct-golden-section"></div>

<script src="https://cdn.jsdelivr.net/chartist.js/latest/chartist.min.js"></script>

<script>

var data={

series: [45, 35, 20]

};

var sum=function(a, b) { return a + b };

new Chartist.Pie('.ct-chart', data, {

labelInterpolationFnc: function(value) {

return Math.round(value / data.series.reduce(sum) * 100) + '%';

}

});

</script>

</body>

</html>

使用 Chartist JavaScript 库,你可以使用各种预先构建好的 CSS 样式,而不是在项目中指定各种与样式相关的部分。你可以使用这些样式来设置已创建的图表的外观。

比如,预创建的 CSS 类 .ct-chart 是用来构建饼状图的容器。还有 .ct-golden-section 类可用于获取纵横比,它基于响应式设计进行缩放,帮你解决了计算固定尺寸的麻烦。Chartist 还提供了其它类别的比例容器,你可以在自己的项目中使用它们。

为了给各个扇形设置样式,可以使用默认的 .ct-serials-a 类。字母 a 是根据系列的数量变化的(a、b、c,等等),因此它与每个要设置样式的扇形相对应。

Chartist.Pie 方法用来创建一个饼状图。要创建另一种类型的图表,比如折线图,请使用 Chartist.Line。

代码的执行结果如下。



3、 D3.js

D3.js 是另一个好用的开源 JavaScript 图表库。使用它需要遵循 BSD 许可证。D3 的主要用途是,根据提供的数据,处理和添加文档的交互功能,。

借助这个 3D 动画库,你可以通过 HTML5、SVG 和 CSS 来可视化你的数据,并且让你的网站变得更精美。更重要的是,使用 D3,你可以把数据绑定到文档对象模型(DOM)上,然后使用基于数据的函数改变文档。

示例代码如下,它使用该库绘制了一个简单的条形图。

<!DOCTYPE html>

<html>

<head>

<style>

.chart div {

font: 15px sans-serif;

background-color: lightblue;

text-align: right;

padding:5px;

margin:5px;

color: white;

font-weight: bold;

}

</style>

</head>

<body>

<div class="chart"></div>

<script src="https://cdnjs.cloudflare.com/ajax/libs/d3/5.5.0/d3.min.js"></script>

<script>

var data=[342,222,169,259,173];

d3.select(".chart")

.selectAll("div")

.data(data)

.enter()

.append("div")

.style("width", function(d){ return d + "px"; })

.text(function(d) { return d; });

</script>

</body>

</html>

使用 D3 库的主要概念是应用 CSS 样式选择器来定位 DOM 节点,然后对其执行操作,就像其它的 DOM 框架,比如 JQuery。

将数据绑定到文档上后,.enter() 函数会被调用,为即将到来的数据构建新的节点。所有在 .enter() 之后调用的方法会为数据中的每一个项目调用一次。

代码的执行结果如下。



总结

JavaScript 图表库提供了强大的工具,你可以将自己的网络资源进行数据可视化。通过这三个开源库,你可以把自己的网站变得更好看,更容易使用。

你知道其它强大的用于创造 JavaScript 动画效果的前端库吗?请在下方的评论区留言分享。


via: https://opensource.com/article/18/9/open-source-javascript-chart-libraries

作者: Dr.Michael J.Garbade 选题: lujun9972 译者: BriFuture 校对: wxy

本文由 LCTT 原创编译, Linux中国 荣誉推出

点击“了解更多”可访问文内链接