2012年03月21日

Wordで作ったWebページをExpression Webで何とかするには

Wordで作ったWebページは、とにかくすごいソースになるということで有名ですね。しかし、元データがWordだったりすると、無駄なコードをすべてクリアして後で整えたいという人は少なくないのでは?と思っています。

残念ながらExpression Web 4でのHTMLの最適化機能では、@から始まるスタイルがスタイルのセレクターと認識されていないっぽいので、除外されているのではないかと私は推測しますが。。。Expression Web 3までならOKです。はい。

とりあえず、ざっと手順を説明します。

  1. Wordでフィルタ後のWebページとして保存しておく
  2. lang属性を除去する
  3. MsoNormalを何とかする
  4. HTMLの最適化を行う

1. Wordでフィルタ後のWebページとして保存しておく

無駄なコードを除去するための条件として、まず、Wordでフィルタ後のWebページとして保存する必要があります。でないと、無駄なxmlタグの羅列で、Expression Webで処理するのは大変です。Word 2003での方法は、一応まだ絶版になってない私の著書があるので参考にしてください(w

2. lang属性を除去する

フィルタ後のWebページとして保存したHTMLでもlang属性が無駄に入ってしまっているので退治するといいでしょう。日本語と英語の切り替えごとに、<span lang=EN-US> やら <span lang=JA>やらよくわからんspanタグが増えていく仕様なのかバグなのかよくわかりませんが生成されます。lang属性が使われているspanタグの除去を行ってから、そのほかの残りのspan属性をすべて除去するようにしてください。でないと、属性なしの<span>文字</span>がたくさん出てくるのでとても厄介です。

詳しくは、Expression Web Tips:lang属性を除去するにはを参考にしてください。

3. MsoNormalを何とかする

MsoNormal というクラススタイルのことを、Word固有のHTMLタグと解釈している人がいますが、これはWord固有のHTMLタグではありません。

詳しくは、Expression Web Tips:MsoNormalを除去するにはを参考にしてください。

4. HTMLの最適化を行う

できれば、Expression Web 3までのバージョンで処理したほうがいいです。はい。

posted by wanichan at 22:12 | Comment(0) | TrackBack(0) | Expression Web はてなブックマーク - Wordで作ったWebページをExpression Webで何とかするには
この記事へのコメント
コメントを書く
お名前: [必須入力]

メールアドレス:

ホームページアドレス:

コメント: [必須入力]

認証コード: [必須入力]


※画像の中の文字を半角で入力してください。
この記事へのトラックバックURL
http://blog.seesaa.jp/tb/259232684
※言及リンクのないトラックバックは受信されません。

この記事へのトラックバック

WebMoney ぷちカンパ