Wordで作ったWebページは、とにかくすごいソースになるということで有名ですね。しかし、元データがWordだったりすると、無駄なコードをすべてクリアして後で整えたいという人は少なくないのでは?と思っています。
残念ながらExpression Web 4でのHTMLの最適化機能では、@から始まるスタイルがスタイルのセレクターと認識されていないっぽいので、除外されているのではないかと私は推測しますが。。。Expression Web 3までならOKです。はい。
とりあえず、ざっと手順を説明します。
- Wordでフィルタ後のWebページとして保存しておく
- lang属性を除去する
- MsoNormalを何とかする
- HTMLの最適化を行う
1. Wordでフィルタ後のWebページとして保存しておく
無駄なコードを除去するための条件として、まず、Wordでフィルタ後のWebページとして保存する必要があります。でないと、無駄なxmlタグの羅列で、Expression Webで処理するのは大変です。Word 2003での方法は、一応まだ絶版になってない私の著書があるので参考にしてください(w
2. lang属性を除去する
フィルタ後のWebページとして保存したHTMLでもlang属性が無駄に入ってしまっているので退治するといいでしょう。日本語と英語の切り替えごとに、<span lang=EN-US> やら <span lang=JA>やらよくわからんspanタグが増えていく仕様なのかバグなのかよくわかりませんが生成されます。lang属性が使われているspanタグの除去を行ってから、そのほかの残りのspan属性をすべて除去するようにしてください。でないと、属性なしの<span>文字</span>がたくさん出てくるのでとても厄介です。
詳しくは、Expression Web Tips:lang属性を除去するにはを参考にしてください。
3. MsoNormalを何とかする
MsoNormal というクラススタイルのことを、Word固有のHTMLタグと解釈している人がいますが、これはWord固有のHTMLタグではありません。
詳しくは、Expression Web Tips:MsoNormalを除去するにはを参考にしてください。
4. HTMLの最適化を行う
できれば、Expression Web 3までのバージョンで処理したほうがいいです。はい。






