Question to say "I can!"

把WORD轉換成HTML

2014-03-24

1.這個程序主要用了IE5.5的一個特性您的瀏覽器必須是IE5.5或以上版本

<html>
<head>
<title>Word2Html</title>
<script language="javascript">
function convert2html(){
html.value = word.innerHTML;
}
</script>
</head>
<body>
<p>請在這里貼入WORD文件內容
<div style="border:1 outset #ffffff; overflow:auto;width:80%;height:50%" id="word" contenteditable></div>
<input type="button" value="轉換成HTML" onclick="convert2html()"><br>
<textarea cols="80" rows="10" id="html"></textarea><br>
注意:您的瀏覽器必須是IE5.5后以上,否則無法插入文字!
</body></html>

 

2.在WORD編輯好 復制到 dreamweaver 保存成HTML

 

3.把Word轉為簡潔的html的若干種方法

word可以直接另存為 htm,但即使是 另存為 html 也會有大量的廢代碼。以前我一般用 dreamweaver 的 clean up html 來處理,先處理 word 特有標簽,然后刪除一些 font,b,span 等。進一步,在 editplus 里面用正則進行處理,最后得到我想要的干凈的html 代碼。當然最完美的辦法就是拷貝文字出來,自己用文本編輯器書寫htm標簽,:)
今天又看到lifehacker這幾種word 2 clean htm方法:
1.使用這個HTML Tidy Library Project開源軟件來處理。
2.微軟官方站點也有個Office 2000 HTML Filter 2.0工具,可以用來處理掉word2000轉html時出現的多余代碼。
3.使用這個Word HTML Cleaner 在線工具來處理。只能處理word2000以下版本。
4.有人給出了正則表達式(其實,上面的各種軟件也都是用正則來解決的)
刪除不需要的標簽
<[/]?(font|span|xml|[ovwxp]:w+)[^>]*?>
- replace any matches with the empty string
刪除class,style...等不需要的屬性
<([^>]*)(?:class|lang|style|size|face|[ovwxp]:w+)=(?:'[^']*'|""[^""]*""|[^>]+)([^>]*)>
- replace any matches with <$1$2>

4.要清理冗余的代碼,可以用WORD CLEANER 4.7.2破解綠色版。

作者:admin | Categories:互聯網問題 | Tags:

發表評論

電子郵件地址不會被公開。 必填項已用*標注

*

澳洲f1赛车b盘开奖套路 今日股票行情查询 在线理财平台灬乾贷网25 山西十一选五 银川站街女实录 山东11选5 乱伦a片网 广东好彩1 体彩宁夏11选五5开奖结果 火箭vs快船全场录像 太原小姐服务电话 广东十一选五免费人 四川麻将一元算钱详细 甘肃11选5一定牛 上马麻里子图片 上海配资风控招聘 花花公子