FC2ブログ

そんなnewsは犬も喰わない

犬も喰わないnewsの数々に斜め横からアレコレ

スポンサーサイト 

上記の広告は1ヶ月以上更新のないブログに表示されています。
新しい記事を書く事で広告が消せます。
[ --/--/-- --:-- ] スポンサー広告 | トラックバック(-) | コメント(-)

ココログ脱出法 

ココログから脱出するにはどうしたら良いのか?さすがに真性マゾの私も真剣に考えざるを得ない昨今であります。

060402_01.jpg



上で引用したファッツ・ヒロミのセリフに深く感動していた私ですが、さすがにもう無理。自称バージョンアップ(3/28)のあともココログではずーっと不具合が続いてます。「一昨年のアメブロみたい」という記述をネットで見て(←書いた人は馬鹿にしているのではなくて心底同情して励ましている感じでしたが)私の中で何かがキレました(笑?)。

はっきり言ってブログの移転はオオゴトだしメンドーだし良いことなんて何もないのですけど、それらのマイナスを考慮してさえも移転の利点が上回る可能性が無視できないほどココログの対応はひどい。ひどすぎる。今いるスタッフの総入れ替えでも起こらない限りは今後の改善も全く期待できません。

と、いうことで移転のノウハウというかアレコレについて以下にまとめてみます。

一応私はFC2への移転というケースについて書いてみましたが、他ブログへの移転などについて知見のある方にそれを記事にしていただいてTBなどいただければ、と期待してます。勉強になりますし移転先の選択肢が増えるのは心強いので。
ええと、まずは手順の大枠について。

(1)ココログの「ブログ」メニューにある「読み込み/書き出し」を選択する。そこで「書き出し」を行う。

(2)「post.htm」という名前のファイルが出力される。これは文字コードがUTF8で改行コードがLFのテキストファイルである。詳しいことはあとで書くが、このテキストファイルに収められているデータ形式はFC2のデータ形式とほぼ同じである。違う点は文字コード(FC2はEUC-JP)と「CONVERT BREAKS: 」という項目の値が「__default__」(ココログ)か「default」(FC2)かという点だけである。

(3)よってココログからFC2への記事データ(コメント&トラックバックを含む)の移管ではpost.htmの文字コードをEUC-JPに変換して「CONVERT BREAKS: 」の値を「default」に置換すれば良いことになる。

(4)上記処理をすませたテキストファイルをFC2ブログの「管理者ページ」→「ツール」→「ログのインポート」から読み込めばデータの移管は完了する。

・・・というだけです。他のブログサービスをみるとこんなに簡単にはいきそうにないですが。

ちょっと見ただけですので実際は何か方法があるのかもしれませんけどgooブログにはデータのインポートメニューはありません(エクスポートに関してはダウンロードというのがあったようですが)し、ExciteやYahooブログにもそういうメニューは無いようでした。

「はてなダイアリー」にはインポートもエクスポートもあるらしいのですが、ココログが「書き出し」で出力してくるファイルとはかなり形式が違っているようです。

で、実際に私は自分のココログ記事データを上記の方法でFC2に移管してみました。その際想定内外の問題が頻発しましたので、それについて若干書いておきます。

(1)テキストファイル文字コード変換での不具合

私はMacOSXを使っているので文字コード変換に「mi」(ダウンロードはこちら)を使おうとしました。ですが、post.htmをUTF8ではなくShiftJISと認識してしまう不具合が発生しました。当然開いたファイルは文字化けしてしまって全く読めません。

ですがこれは「mi」の不具合というよりも出力されたpost.htmのUTF8データの中におかしなものが含まれてしまっていたからのようです。ターミナルを起動してiconvという文字変換ツールを使ってもcannot convertというエラーが出ていました。

この問題については次のように対処しました。

(a)post.htmの拡張子をpost.txtに変える。
(b)Firefoxで開く。
(c)ブラウザウィンドウ内ではまともに表示される。
(d)表示されているものをコピペ。

この方法でなんとか対処しました。ですがこの方法を使ってもやはり問題は発生しました。

Unicodeペースト失敗
クリップボードの中にUnicodeから内部文字コードへ変換できない文字がありました。内部文字コードでコピーします。(内部文字コードはフォントによって変わります)

上記のようなアラートが出ました。全体を一気にコピペすると上記アラートが出て何もペーストされない現象がおきて焦りましたが、少しずつ分割してコピペしていったところ頻繁に上記アラートは出たものの(出ないときもありました)一部が文字化けするのみでなんとか作業はできました。

結局2005年6月30日の記事の中に何かとてつもなくエラーを起こすものが含まれていたらしいということが判明しましたが、それが何かはまだわかっていません。

いずれにせよUTF8がOSやアプリケーションソフトによって誤認識されたりするらしい(UTF8はUnicodeと言っても名ばかりの欠陥コードのようですし、機種依存文字やら何やらは相変わらず存在してます)ことに起因する問題のようです。

(2)記事の途中なのにコメントやTBと誤認識される不具合

post.htmの中身は次のような単純な記述になっています。

AUTHOR: ccoe
TITLE: FC2ブログで色々テストしてます
STATUS: Publish
ALLOW COMMENTS: 0
CONVERT BREAKS: default
ALLOW PINGS: 1
PRIMARY CATEGORY: blog
CATEGORY: blog

DATE: 03/29/2006 00:00:00
-----
BODY:
ココログから移ってくるかもしれません。

そんなわけで色々テストしてみてます。
-----
EXTENDED BODY:
習うより慣れろって感じで。
-----
EXCERPT:

-----
KEYWORDS:

-----
PING:
TITLE: FC2ブログを試してみます
URL: http://ccoe.cocolog-nifty.com/news/2006/03/fc2_cee6.html
IP: 202.***.***.**
BLOG NAME: そんなnewsは犬も喰わない
DATE: 03/29/2006 15:32:39
ま、予想通りではあったのですが、色々すごいことになっているようです。 と、ヒトゴ
-----


--------

PINGとあるのはTBのことで、コメントがあればその上に「COMMENT:」として同様のものが入ります。

非常に単純な記述なので、この記事のように引用したりすると、それも記事の構造や情報を記述した部分とインポート時に受け取られてしまうようです。

ですので、インポートされた記事が途中で切れて、ほとんど空の内容のコメントがついた記事として読み込まれてしまう不具合が起きます。

また「---」のような記述があるだけでも誤読がおきるようで、そういう記述を頻繁にしていた人はインポートする前に別の記号に置換するなどの処置をしておいた方が良さそうです。

(3)インポート可能サイズの制限

あまり大きすぎるテキストファイルは読み込めないようでした。私は比較的長いエントリを書くので、大体90エントリを越えるようなものは読み込まれませんでした。2分割したところ問題なく読み込んだのでサイズの問題だと判断しました。

また今回私がブログを書き始めた最初期のころの記事も読み込ませてみたところ、そちらは一つあたりの記事が短いので170エントリを越えるものでも一度に読み込ませることができました。

(4)画像の扱い

post.htm改めpost.txtに手を加えずインポートすると画像へのリンクもそのままココログ内部のアドレスになります。ココログのデータを完全消去する場合にはこれは問題になります。ココログのデータが残っている場合には見た目上は問題なく表示されるので不具合とはいえないかもしれませんが。

とりあえずこんなところです。やってみた感想としては「案外簡単だったな」というところ。

ブログデータの移管がスムーズに出来て、そういうものの流動性が高まればユーザを一旦囲い込んでしまってからブログサービス運営側が手抜きをしたりボッタクッタりしにくくなるので、良い事だと思います。

逆に言えばサービス運営側はそういうユーザの動きは阻止したいでしょうから、こういう情報について親切に手取り足取り教えてくれるとは期待できません。

出来るかぎりユーザ同士で協力し合っていければなー、と思ったりしてます。

なんか、そんな感じで。
スポンサーサイト
[ 2006/04/02 00:00 ] ウェブログ・ココログ関連 | TB(0) | コメント(-)
プロフィール

犬桑主監

Author:犬桑主監
正式略称は「犬桑news」です。
気軽に呼んでください。

ブログ検索
総合案内

ブロとも申請フォーム


上記広告は1ヶ月以上更新のないブログに表示されています。新しい記事を書くことで広告を消せます。