于安全和隐私的原因,web 应用程序不能直接访问用户设备上的文件。如果需要读取一个或多个本地文件,可以通过使用input file和FileReader来实现。在这篇文章中,我们将通过一些例子来看看它是如何工作的。
由于浏览器中的 JS 无法从用户的设备访问本地文件,我们需要为用户提供一种方法来选择一个或多个文件供我们使用。这可以通过文件选择器<input type='fule' />来完成。
<input type="file" id="fileInput">
如果想允选择多个文件,可以添加multiple属性:
<input type="file" id="fileInput" multiple>
我们可以通过change事件来监听文件的选择,也可以添加另一个 UI 元素让用户显式地开始对所选文件的处理。
input file 具有一个files属性,该属性是File对象的列表(可能有多个选择的文件)。
File对象如下所示:
读取文件,主要使用的是[FileReader][1]类。
「该对象拥有的属性:」
「FileReader.error」 :只读,一个DOMException,表示在读取文件时发生的错误 。
「FileReader.readyState」:只读 表示 FileReader 状态的数字。取值如下:
常量名值描述EMPTY0还没有加载任何数据LOADING1数据正在被加载DONE2已完成全部的读取请求
「FileReader.result」:只读,文件的内容。该属性仅在读取操作完成后才有效,数据的格式取决于使用哪个方法来启动读取操作。
「该对象拥有的方法:」
readAsText(file, encoding):以纯文本形式读取文件,读取到的文本保存在result属性中。第二个参数代表编码格式。
readAsDataUrl(file):读取文件并且将文件以数据URI的形式保存在result属性中。
readAsBinaryString(file):读取文件并且把文件以字符串保存在result属性中。
readAsArrayBuffer(file):读取文件并且将一个包含文件内容的ArrayBuffer保存咋result属性中。
FileReader.abort():中止读取操作。在返回时,readyState属性为DONE。
「文件读取的过程是异步操作,在这个过程中提供了三个事件:progress、error、load事件。」
progress:每隔50ms左右,会触发一次progress事件。
error:在无法读取到文件信息的条件下触发。
load:在成功加载后就会触发。
在下面的示例中,我们将使用readAsText和readAsDataURL方法来显示文本和图像文件的内容。
为了将文件内容显示为文本,change需要重写一下:
首先,我们要确保有一个可以读取的文件。如果用户取消或以其他方式关闭文件选择对话框而不选择文件,我们就没有什么要读取和退出函数。
然后我们继续创建一个FileReader。reader的工作是异步的,以避免阻塞主线程和 UI 更新,这在读取大文件(如视频)时非常重要。
reader发出一个'load'事件(例如,类似于Image对象),告诉我们的文件已经读取完毕。
reader将文件内容保存在其result属性中。此属性中的数据取决于我们使用的读取文件的方法。在我们的示例中,我们使用readAsText方法读取文件,因此result将是一个文本字符串。
如果我们想要显示图像,将文件读取为字符串并不是很有用。FileReader有一个readAsDataURL方法,可以将文件读入一个编码的字符串,该字符串可以用作<img>元素的源。本例的代码与前面的代码基本相同,区别是我们使用readAsDataURL读取文件并将结果显示为图像:
1)由于安全和隐私的原因,JavaScript 不能直接访问本地文件。
2)可以通过 input 类型为 file 来选择文件,并对文件进行处理。
3) file input 具有带有所选文件的files属性。
4) 我们可以使用FileReader来访问所选文件的内容。
作者: Martin Splitt 译者:前端小智 来源:dev
原文:https://dev.to/g33konaut/reading-local-files-with-javascript-25hn
不多说直接上代码[狗头]
function getitle(path) {
return new Promise((resolve, reject) => {
var xhr = new XMLHttpRequest();
xhr.open("get", path);
xhr.send();
xhr.onload = function(ms) {
if (xhr.status == 200) {
var contenx = xhr.responseText;
var star = contenx.indexOf('<title>') + 7;
var end = contenx.indexOf('</title>');
resolve(contenx.substring(star, end));
}
}
})
}
这里使用了Promise,可以在async中使用await处理异步问题;
接下来一个例子[左上]: 获取多个a标签,并获取该Link的title内容后拼接为新的a标签,然后保存为txt;也就是这种格式: <a href="" alt="">xxx</a>
function save2text(data, filename) { //这个函数是保存为txt格式
if (!data) {
console.error('Console.save: No data')
return;
}
if (!filename) filename = 'linka.txt'
if (typeof data === "object") {
data = JSON.stringify(data, undefined, 4)
}
var blob = new Blob([data], {
type: 'text/plain;charset=utf-8'
}),
e = document.createEvent('MouseEvents'),
a = document.createElement('a')
a.download = filename
a.href = window.URL.createObjectURL(blob)
a.dataset.downloadurl = ['text/plain', a.download, a.href].join(':')
e.initMouseEvent('click', true, false, window, 0, 0, 0, 0, 0, false, false, false, false, 0, null)
a.dispatchEvent(e)
}
function getitle(path) { //这个是获取url的title
return new Promise((resolve, reject) => {
var xhr = new XMLHttpRequest();
xhr.open("get", path);
xhr.send();
xhr.onload = function(ms) {
if (xhr.status == 200) {
var contenx = xhr.responseText;
var star = contenx.indexOf('<title>') + 7;
var end = contenx.indexOf('</title>');
resolve(contenx.substring(star, end));
}
}
})
}
var tems = '';
var aa = document.querySelectorAll("#content a"); //获得a元素
Promise.all(Array.prototype.map.call(aa, async (item, index) => { //执行同步Promise队列
var ss = await getitle(item.href);
tems += '<a href="' + item.href + '" alt="' + ss + '">' + ss + '</a>\n\r';
})).then(() => {
console.log('构造成功,正在导出文件...');
save2text(tems);
});
以上就是实现过程; 当然这可以天马行空[思考],或者你可以直接保存title等等; 以上代码是我用来解析站点sitemap的所有Link并保存,方便我进行外链布置[看]
--文章来源于本人个人站点,同为原创作者,转载需注明出处:使用JS获取网页的title内容_解析SiteMap,布置外链 | 瑷程序
JavaScript 提供了许多方法来检索和更改显示在浏览器地址栏中的当前 URL,所有这些方法都使用Location对象,它是对象的一个属性Window。
您可以创建一个具有当前URL的新对象,如下所示:
let loc = window.location;
let url = loc.href;
location属性
Location 接口不继承任何属性,但是实现了那些来自 URLUtils 的属性。
Location.href包含整个URL的一个DOMStringLocation.protocol包含URL对应协议的一个DOMString,最后有一个":"。
Location.host包含了域名的一个DOMString,可能在该串最后带有一个":"并跟上URL的端口号。
Location.hostname包含URL域名的一个DOMString。
Location.port包含端口号的一个DOMString。
Location.pathname包含URL中路径部分的一个DOMString,开头有一个“/"。Location.search 包含URL参数的一个DOMString,开头有一个“?”。
Location.hash包含块标识符的DOMString,开头有一个“#”。
Location.username包含URL中域名前的用户名的一个DOMString。
Location.password包含URL域名前的密码的一个 DOMString。
Location.origin只读包含页面来源的域名的标准形式DOMString。
Location没有继承任何方法,但实现了来自URLUtils的方法。
Location.assign()加载给定URL的内容资源到这个Location对象所关联的对象上。
Location.reload()重新加载来自当前 URL的资源。他有一个特殊的可选参数,类型为 Boolean,该参数为true时会导致该方法引发的刷新一定会从服务器上加载数据。如果是 false或没有制定这个参数,浏览器可能从缓存当中加载页面。
Location.replace()用给定的URL替换掉当前的资源。与 assign() 方法不同的是用 replace()替换的新页面不会被保存在会话的历史 History中,这意味着用户将不能用后退按钮转到该页面。
Location.toString()返回一个DOMString,包含整个URL。 它和读取URLUtils.href的效果相同。但是用它是不能够修改Location的值的。
*请认真填写需求信息,我们会在24小时内与您取得联系。