過去ログ表示


過去ログ 15 を表示

トピック内全 10 記事中の 1 〜 10 番目を表示
[ 最新記事及び返信フォームをトピックトップへ ]
このトピックの全ページ / [0]

NN4.78のブックマークをインポートしたい
(#2274) このトピック中1番目の投稿

NN4.78からMozilla Build ID:2002053012へ、ブックマークをインポートしたいと思い、imdkcvを使って、次のようなバッチファイルを作ってみました。環境は、Win98SEです。

SET FROMPATH=C:\Program Files\Netscape\Users\default
SET TOPATH=C:\WINDOWS\Application Data\Mozilla\Profiles\default\x8d3wij6.slt

COPY "%TOPATH%\bookmarks.html" "%TOPATH%\bookmarks.old"
IMDKCV "%FROMPATH%\bookmark.htm" -Sn -u8 -o "%TOPATH%\bookmarks.html"

SET TOPATH=
SET FROMPATH=

しかしやってみると、Mozillaのブックマークが文字化けを起こして読めません。
何か、まちがっている点があるでしょうか。もしご存じでしたら、ご教示いただければ幸いです。


Re[1]: NN4.78のブックマークをインポートしたい
(#2279) このトピック中2番目の投稿

> しかしやってみると、Mozillaのブックマークが文字化けを起こして読めません。
> 何か、まちがっている点があるでしょうか。もしご存じでしたら、ご教示いただければ幸いです。
>

とりあえず

- UTF-8 を扱うことができるエディタで見てみる。
- その結果の bookmarks.html を Mozilla にブックマークとして
 ではなく単なる HTMLファイルとして表示させてみる。

を試してみて、なにか変なところはないか見てみては
いかがでしょうか。


NN4.78のブックマークをインポートしたい
(#2282) このトピック中3番目の投稿

> とりあえず
>
> - UTF-8 を扱うことができるエディタで見てみる。
> - その結果の bookmarks.html を Mozilla にブックマークとして
>  ではなく単なる HTMLファイルとして表示させてみる。
>
> を試してみて、なにか変なところはないか見てみては
> いかがでしょうか。

ご返事ありがとうございます。
エディタとMozillaで見てみましたところ、やはり2バイト文字は文字化けしています。UTF-8でも、Shift JISで見ても、同じでした。
imdkcvのマニュアル通りのはずなので、どうしたものかと思っております。



Re[3]: NN4.78のブックマークをインポートしたい
(#2284) このトピック中4番目の投稿

> ご返事ありがとうございます。
> エディタとMozillaで見てみましたところ、やはり2バイト文字は文字化けしています。UTF-8でも、Shift JISで見ても、同じでした。
> imdkcvのマニュアル通りのはずなので、どうしたものかと思っております。

思いつくのは...

1)変換元の bookmark.htm は問題ないか?
 Win版NCなら Shift_JIS の HTMLファイルだと思いますが、そもそも
 変換元のファイルに変な文字が混入してないか確認してください。
 そもそも Shift_JIS なのかも確認してください。

2)変換結果の bookmarks.html のうち、文字化けする範囲の特徴は?
 全ての non-ascii文字が文字化けするのか特定文字だけなのか
 あるいは特定のURLのブックマークだけなのか...

3)試しにそのほかの方法で文字コード変換を試みる。

4)bookmarks.html を直接作業するのではなく、Mozilla の Bookmarks
 Manager の Import 機能を使って bookmark.htm ファイルを
 インポートしてみる。


Re[3]: NN4.78のブックマークをインポートしたい
(#2285) このトピック中5番目の投稿

> エディタとMozillaで見てみましたところ、やはり2バイト文字は文字化けしています。UTF-8でも、Shift JISで見ても、同じでした。
> imdkcvのマニュアル通りのはずなので、どうしたものかと思っております。

> SET FROMPATH=C:\Program Files\Netscape\Users\default
> SET TOPATH=C:\WINDOWS\Application Data\Mozilla\Profiles\default\x8d3wij6.slt
> COPY "%TOPATH%\bookmarks.html" "%TOPATH%\bookmarks.old"
> IMDKCV "%FROMPATH%\bookmark.htm" -Sn -u8 -o "%TOPATH%\bookmarks.html"
> SET TOPATH=
> SET FROMPATH=

このバッチでは、"%TOPATH%\bookmarks.html" はすでにあるものに見えますが、
IMDKCVの直前に DELETE "%TOPATH%\bookmarks.html" を入れるとどうなりますか?

IMDKCVの開発者さんのサイトには、
> ファイル操作関係
> -ov 処理結果を入力ファイルに上書き
> -o output_file_name 処理結果を指定されたファイルに書き込む
と書いてあります。
「上書き」と「書き込む」とを使いわけているので、
出力時のオープンが、「上書き」はファイルの先頭からのモード、「書き込む」は追加モード、という可能性があります。
リダイレクトの、 > と >> みたいなものです。
-ov のためには読み込んだあとクローズする操作も必要なので、それでわけているだけかも知れないですが。


NN4.78のブックマークをインポートしたい
(#2288) このトピック中6番目の投稿

早速のご返事、ありがとうございます。

> 1)変換元の bookmark.htm は問題ないか?
>  Win版NCなら Shift_JIS の HTMLファイルだと思いますが、そもそも
>  変換元のファイルに変な文字が混入してないか確認してください。
>  そもそも Shift_JIS なのかも確認してください。

すべてShift_JISでした。機種依存文字を含め、変な文字は入っていません。

> 2)変換結果の bookmarks.html のうち、文字化けする範囲の特徴は?
>  全ての non-ascii文字が文字化けするのか特定文字だけなのか
>  あるいは特定のURLのブックマークだけなのか...

全ての2バイト文字が文字化けしています。

> 3)試しにそのほかの方法で文字コード変換を試みる。

エディタを使って、UTF-8に変換したファイルをMozillaに読み込ませたところ、やはり文字化けしました。理由は私には不明です。

> 4)bookmarks.html を直接作業するのではなく、Mozilla の Bookmarks
>  Manager の Import 機能を使って bookmark.htm ファイルを
>  インポートしてみる。

インポートは問題なくできるのですが、現在のブックマークに追加されるため、いったん、Mozillaのブックマークをすべて削除して、インポートしなければなりません。それもちょっと面倒なので、もっと簡単な方法があれば、と思います。



NN4.78のブックマークをインポートしたい
(#2289) このトピック中7番目の投稿

 ご返事をありがとうございます。

>>SET FROMPATH=C:\Program Files\Netscape\Users\default
>>SET TOPATH=C:\WINDOWS\Application Data\Mozilla\Profiles\default\x8d3wij6.slt
>>COPY "%TOPATH%\bookmarks.html" "%TOPATH%\bookmarks.old"
>>IMDKCV "%FROMPATH%\bookmark.htm" -Sn -u8 -o "%TOPATH%\bookmarks.html"
>>SET TOPATH=
>>SET FROMPATH=
>
> このバッチでは、"%TOPATH%\bookmarks.html" はすでにあるものに見えますが、
> IMDKCVの直前に DELETE "%TOPATH%\bookmarks.html" を入れるとどうなりますか?

「コマンドまたはファイル名がまちがっています」となります。

> IMDKCVの開発者さんのサイトには、
>>ファイル操作関係
>> -ov 処理結果を入力ファイルに上書き
>> -o output_file_name 処理結果を指定されたファイルに書き込む
> と書いてあります。
> 「上書き」と「書き込む」とを使いわけているので、
> 出力時のオープンが、「上書き」はファイルの先頭からのモード、「書き込む」は追加モード、という可能性があります。
> リダイレクトの、 > と >> みたいなものです。
> -ov のためには読み込んだあとクローズする操作も必要なので、それでわけているだけかも知れないですが。

-ovは、「入力ファイルに上書き」なので、試しにやってみたら、入力ファイル(bookmark.htm)が文字化けしたファイルになってしまいました。


Re[5]: NN4.78のブックマークをインポートしたい
(#2290) このトピック中8番目の投稿


>>2)変換結果の bookmarks.html のうち、文字化けする範囲の特徴は?
>> 全ての non-ascii文字が文字化けするのか特定文字だけなのか
>> あるいは特定のURLのブックマークだけなのか...
>
> 全ての2バイト文字が文字化けしています。
>
>>3)試しにそのほかの方法で文字コード変換を試みる。
>
> エディタを使って、UTF-8に変換したファイルをMozillaに読み込ませたところ、やはり文字化けしました。理由は私には不明です。

そもそも、UTF-8 に変換した結果のファイルをエディタで見たときには
既に文字化け(=UTF-8として不正な文字)しているのですか?

そうであれば、Mozilla以前の問題です。 文字コード変換が失敗しています。

エディタで UTF-8 のファイルとして見た場合には文字化けしていない
(正しく UTF-8のファイルになっている)場合、今度はそれが UTF-8 で
記述された HTMLファイルとして正しいかどうかは、どうなのでしょうか?

たとえば Shift_JISで記述され更に内部に
<meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS">
と記述されている HTMLファイルを、文字コード変換ツールを
使って文字コードを Shift_JIS以外に変換した場合、文字コードは
変換されていても META要素による文字コード宣言は変わっていないので
HTMLファイルとしては正しくありません。(META要素による宣言と実際の
文字コードが食い違っている) そういう HTMLファイルをブラウザは
Shift_JISだと思い込んで処理し、文字化けしてしまうでしょう。


ファイルの中身の妥当性を確認してください。


NN4.78のブックマークをインポートしたい
(#2294) このトピック中9番目の投稿

> そもそも、UTF-8 に変換した結果のファイルをエディタで見たときには
> 既に文字化け(=UTF-8として不正な文字)しているのですか?
>
> そうであれば、Mozilla以前の問題です。 文字コード変換が失敗しています。
>
> エディタで UTF-8 のファイルとして見た場合には文字化けしていない
> (正しく UTF-8のファイルになっている)場合、今度はそれが UTF-8 で
> 記述された HTMLファイルとして正しいかどうかは、どうなのでしょうか?
>
> たとえば Shift_JISで記述され更に内部に
> <meta http-equiv="Content-Type" content="text/html; charset=Shift_JIS">
> と記述されている HTMLファイルを、文字コード変換ツールを
> 使って文字コードを Shift_JIS以外に変換した場合、文字コードは
> 変換されていても META要素による文字コード宣言は変わっていないので
> HTMLファイルとしては正しくありません。(META要素による宣言と実際の
> 文字コードが食い違っている) そういう HTMLファイルをブラウザは
> Shift_JISだと思い込んで処理し、文字化けしてしまうでしょう。
>
> ファイルの中身の妥当性を確認してください。

おっしゃる通り、Mozilla以前に文字化けしています。
Netscapeのbookmark..htmを見ましたが、META宣言はないようです。関係があるとすれば、以下の一行です。

<!DOCTYPE NETSCAPE-Bookmark-file-1>

これ以外には、指定はありませんでした。
しかし、コード変換ができませんので、とりあえず諦めて、インポート機能で対応しようと思います。
どうもありがとうございました。
済!
Re[6]: NN4.78のブックマークをインポートしたい
(#2298) このトピック中10番目の投稿

imdkcv の名誉のため書いておきますが、私の手元にある
NC4.7の bookmark.htm (238KB/Shift_JIS)を imdkcv/win32 で
UTF-8 に変換し、それを再び Shift_JIS に変換し戻した
ものを大元の bookmark.htm と比較しましたが、差異は無く
一致しました。 もちろん、中間の UTF-8 時点でもコードは
確認しています。

なにかのどこかに問題があるのだろうとは思いますが...


済!

このトピックの全ページ / [0]

返信不可


- Child Tree -