JavaScript 如何读取本地文件

于安全和隐私的原因，web 应用程序不能直接访问用户设备上的文件。如果需要读取一个或多个本地文件，可以通过使用input file和FileReader来实现。在这篇文章中，我们将通过一些例子来看看它是如何工作的。

文件操作的流程

获取文件

由于浏览器中的 JS 无法从用户的设备访问本地文件，我们需要为用户提供一种方法来选择一个或多个文件供我们使用。这可以通过文件选择器<input type='fule' />来完成。

<input type="file" id="fileInput">

如果想允选择多个文件，可以添加multiple属性:

<input type="file" id="fileInput" multiple>

我们可以通过change事件来监听文件的选择，也可以添加另一个 UI 元素让用户显式地开始对所选文件的处理。

input file 具有一个files属性，该属性是File对象的列表（可能有多个选择的文件）。

File对象如下所示：

读取文件

读取文件，主要使用的是[FileReader][1]类。

「该对象拥有的属性：」

「FileReader.error」 ：只读，一个DOMException，表示在读取文件时发生的错误。

「FileReader.readyState」：只读表示 FileReader 状态的数字。取值如下：

常量名值描述EMPTY0还没有加载任何数据LOADING1数据正在被加载DONE2已完成全部的读取请求

「FileReader.result」：只读，文件的内容。该属性仅在读取操作完成后才有效，数据的格式取决于使用哪个方法来启动读取操作。

「该对象拥有的方法：」

readAsText(file, encoding)：以纯文本形式读取文件，读取到的文本保存在result属性中。第二个参数代表编码格式。

readAsDataUrl(file)：读取文件并且将文件以数据URI的形式保存在result属性中。

readAsBinaryString(file)：读取文件并且把文件以字符串保存在result属性中。

readAsArrayBuffer(file)：读取文件并且将一个包含文件内容的ArrayBuffer保存咋result属性中。

FileReader.abort()：中止读取操作。在返回时，readyState属性为DONE。

「文件读取的过程是异步操作，在这个过程中提供了三个事件：progress、error、load事件。」

progress：每隔50ms左右，会触发一次progress事件。

error：在无法读取到文件信息的条件下触发。

load：在成功加载后就会触发。

在下面的示例中，我们将使用readAsText和readAsDataURL方法来显示文本和图像文件的内容。

例一：读取文本文件

为了将文件内容显示为文本，change需要重写一下：

首先，我们要确保有一个可以读取的文件。如果用户取消或以其他方式关闭文件选择对话框而不选择文件，我们就没有什么要读取和退出函数。

然后我们继续创建一个FileReader。reader的工作是异步的，以避免阻塞主线程和 UI 更新，这在读取大文件(如视频)时非常重要。

reader发出一个'load'事件(例如，类似于Image对象)，告诉我们的文件已经读取完毕。

reader将文件内容保存在其result属性中。此属性中的数据取决于我们使用的读取文件的方法。在我们的示例中，我们使用readAsText方法读取文件，因此result将是一个文本字符串。

例二：显示本地选择的图片

如果我们想要显示图像，将文件读取为字符串并不是很有用。FileReader有一个readAsDataURL方法，可以将文件读入一个编码的字符串，该字符串可以用作<img>元素的源。本例的代码与前面的代码基本相同，区别是我们使用readAsDataURL读取文件并将结果显示为图像:

总结

1）由于安全和隐私的原因，JavaScript 不能直接访问本地文件。

2）可以通过 input 类型为 file 来选择文件，并对文件进行处理。

3） file input 具有带有所选文件的files属性。

4）我们可以使用FileReader来访问所选文件的内容。

作者: Martin Splitt 译者：前端小智来源：dev

原文：https://dev.to/g33konaut/reading-local-files-with-javascript-25hn

不多说直接上代码[狗头]

function getitle(path) {
	return new Promise((resolve, reject) => {
		var xhr = new XMLHttpRequest();
		xhr.open("get", path);
		xhr.send();
		xhr.onload = function(ms) {
		if (xhr.status == 200) {
			var contenx = xhr.responseText;
			var star = contenx.indexOf('<title>') + 7;
			var end = contenx.indexOf('</title>');
			resolve(contenx.substring(star, end));
		}
		}
	})
}

这里使用了Promise,可以在async中使用await处理异步问题;

接下来一个例子[左上]: 获取多个a标签,并获取该Link的title内容后拼接为新的a标签,然后保存为txt;也就是这种格式: <a href="" alt="">xxx</a>

function save2text(data, filename) { //这个函数是保存为txt格式

 if (!data) {
        console.error('Console.save: No data')
        return;
    }

    if (!filename) filename = 'linka.txt'

    if (typeof data === "object") {
        data = JSON.stringify(data, undefined, 4)
    }

    var blob = new Blob([data], {
            type: 'text/plain;charset=utf-8'
        }),
        e = document.createEvent('MouseEvents'),
        a = document.createElement('a')

 a.download = filename
    a.href = window.URL.createObjectURL(blob)
    a.dataset.downloadurl = ['text/plain', a.download, a.href].join(':')
    e.initMouseEvent('click', true, false, window, 0, 0, 0, 0, 0, false, false, false, false, 0, null)
    a.dispatchEvent(e)
}

function getitle(path) { //这个是获取url的title
    return new Promise((resolve, reject) => {
        var xhr = new XMLHttpRequest();
        xhr.open("get", path);
        xhr.send();
        xhr.onload = function(ms) {
            if (xhr.status == 200) {
                var contenx = xhr.responseText;
                var star = contenx.indexOf('<title>') + 7;
                var end = contenx.indexOf('</title>');
                resolve(contenx.substring(star, end));
            }
        }
    })
}
var tems = '';
var aa = document.querySelectorAll("#content a"); //获得a元素
Promise.all(Array.prototype.map.call(aa, async (item, index) => { //执行同步Promise队列
    var ss = await getitle(item.href);
    tems += '<a href="' + item.href + '" alt="' + ss + '">' + ss + '</a>\n\r';
})).then(() => {
    console.log('构造成功,正在导出文件...');
    save2text(tems);
});

以上就是实现过程; 当然这可以天马行空[思考],或者你可以直接保存title等等; 以上代码是我用来解析站点sitemap的所有Link并保存,方便我进行外链布置[看]

--文章来源于本人个人站点,同为原创作者,转载需注明出处:使用JS获取网页的title内容_解析SiteMap,布置外链 | 瑷程序

RL 信息

JavaScript 提供了许多方法来检索和更改显示在浏览器地址栏中的当前 URL，所有这些方法都使用Location对象，它是对象的一个属性Window。

您可以创建一个具有当前URL的新对象，如下所示：

let loc = window.location;
let url = loc.href;

Location 属性

location属性

Location 接口不继承任何属性，但是实现了那些来自 URLUtils 的属性。

Location.href包含整个URL的一个DOMStringLocation.protocol包含URL对应协议的一个DOMString，最后有一个":"。

Location.host包含了域名的一个DOMString，可能在该串最后带有一个":"并跟上URL的端口号。

Location.hostname包含URL域名的一个DOMString。

Location.port包含端口号的一个DOMString。

Location.pathname包含URL中路径部分的一个DOMString，开头有一个“/"。Location.search 包含URL参数的一个DOMString，开头有一个“?”。

Location.hash包含块标识符的DOMString，开头有一个“#”。

Location.username包含URL中域名前的用户名的一个DOMString。

Location.password包含URL域名前的密码的一个 DOMString。

Location.origin只读包含页面来源的域名的标准形式DOMString。

方法

Location没有继承任何方法，但实现了来自URLUtils的方法。

Location.assign()加载给定URL的内容资源到这个Location对象所关联的对象上。

Location.reload()重新加载来自当前 URL的资源。他有一个特殊的可选参数，类型为 Boolean，该参数为true时会导致该方法引发的刷新一定会从服务器上加载数据。如果是 false或没有制定这个参数，浏览器可能从缓存当中加载页面。

Location.replace()用给定的URL替换掉当前的资源。与 assign() 方法不同的是用 replace()替换的新页面不会被保存在会话的历史 History中，这意味着用户将不能用后退按钮转到该页面。

Location.toString()返回一个DOMString，包含整个URL。它和读取URLUtils.href的效果相同。但是用它是不能够修改Location的值的。

在线咨询

上一篇：JavaScript FireFox支持innerText
下一篇：HTML图像标记

您的项目需求

*请认真填写需求信息，我们会在24小时内与您取得联系。

整合营销服务商