NH-kindle宣言!

 エヌエイチ、キンドル宣言であります。C#だから覚えるのにそんなに時間がかからないと思いますが・・・・・

 事の起こりはNHKのrssだとYahoo Pipeで画像も綺麗に取れるという事実(ツールバーが恥ずかしい件は省略w)。pubDateもしっかりしております。

image

すべてのカテゴリにおいてNHKは綺麗に全文取得できます。さらに、主の環境で唯一TVを録画しているニュース解説系もいけます(ツールバーが恥ずかしい件は再び省略w)。

image

そしてワンピースとともに唯一検索録画を継続している「けいおん」、じゃなくてNHKスペシャルの告知も取れます。さすが独占企業w。

image

 

ならば!「NHKニュースでkindle用の新聞作れるんじゃね?」


で今回はお送りします(きっかけ編です)。

 kindle用のmobiを生成する問題点は3つ。kindle書籍化はcalibreでやればいいじゃね?というのは無理、PHP、C#だけでも苦労しているのに今更Pythonをやれるか!!calibreが普通に日本語に対応していれば問題なかったのですが・・・(でも多分、そっちを触ったほうが有志も多くて近道なんだろうけど・・・・)

  1. rssを如何にしてhtmlに変換するか?
  2. webサーバ側で全部やるとなるとセッションだのなんだの面倒だよw
  3. 目次を作るのがめんどくさいw

1.問題を少しずつ解決。rss2htmlについてはこのページ。テンプレートが使えますのでkindle専用の改行タグが挿入できます。ニュース解説に適用してみた結果はこちら。rss2htmlを動かすだけでも、やれURLのエンコードとかデフォルト出力の文字コードとかいろいろあったんですよ。でも基本他力本願。

image

まぁ時間あれば、お試しください。?の後にXMLFILE=xxxxxxxでRSSを指定すればhtmlに変換します。xxxxxxxxの部分はURLエンコードしないとだめです。例えば?The AMD’s Cafeだとこんな感じ

 RSS2htmlのphpに関しては、デフォルトの設定から出力をISO-8859-1からUTF-8にしてショート形式の時間表示を日本風に変えました。ちなみにkindle用の時論公論取得用のテンプレートはこんな感じです。

<HTML>
    <HEAD>
        <meta http-equiv=”content-type” content=”text/html;charset=utf-8″>
        <TITLE>
            ~~~FeedTitle~~~
        </TITLE>

<style type=”text/css”>
p {
text-indent:0em;
}

</style>

           
    </HEAD>
    <BODY>
        <H1>~~~FeedTitle~~~</H1><br></br>
        ~~~FeedDescription~~~
        <BR>
        <mbp:pagebreak />
            ~~~BeginItemsRecord~~~
                    <B><h2><A href=”~~~ItemLink~~~”>~~~ItemTitle~~~</A></h2></B><BR>
                    <Div Align=”right”>   
                    ~~~ItemPubShortDate~~~ ~~~ItemPubShortTime~~~
                    </Div>
                    <BR>
                    ~~~ItemDescription~~~
                <mbp:pagebreak />
            ~~~EndItemsRecord~~~
            <mbp:pagebreak />
    </BODY>
</HTML>

字下げの0指定と改ページぐらいすね、ノウハウとしてはw。0指定をしないと2文字下げられますからw。しかしkindle touchで左右キーの章移動はどーなるんだ?日本語版がでるまで様子見なのがつらい。

image
HTMLのままメール変換経由でkindleに送った場合です。すいませんkindleのUSBが壊れていてスクリーンショットをとれないもんで、iPodでw。

まぁ、rss2kindleでRSSをHTMLに変換したhtmlファイルを保存してSend to kindleするなりkindlegenすれば、それなりに読めます、「名前を付けて保存」してkindlegenすれば画像が付いてくるし。でも、まとめて新聞として読みたいんです。calibreが最適なのだがあのフォントは許せない!

 

2.kindele朝刊のスクリプトを利用すれば、不完全だけど同じRSSだからNHkindleもいけるはず。PowerShellって相当凄いですわw、まぁその程度の柔軟性はあるレベルでコードを書いたつもりなのですが・・・。rssのhtmlでかっこいい設定は有識者のテンプレートに任せておきます。こちらは目次の作成とかをせこせこ考えて、昔懐かしのクライアント側でC#でやればいい、そうGreader2kindleのように。実際、PHPにして完全サーバー化かったんだけどが・・・・いろいろ覚えるのがさらに面倒になりますので。というわけで現状はこの程度です。

一覧画面

image

目次(タイトルが全部一緒だw)

image

見栄えのいいところを

image

実際はもっと見やすいんですよ

image

時論公論のページ

image

 というわけでお試し原本をおいておきます

image
 PC版kindleだと2度開かないと見れないかもw。

 

3.誰かHTMLファイルのリストから自動的に目次を作ってくれる人いないかな?できれば商用形式でw。kindlegenの1.1検索したらもっていましたw。しかたない、NHKでカテゴリ固定の決め打ちでいいかなw。


 というわけで、4月になるとNHKのページも変わりそうなのでなんとかしたいのですが、kindle3だと半角記号系が全滅だの、主要ニュースと番組情報は改ページがないほうがいいとか、字下げはNHKだと0でいけるが他はあったほうがいいとか。でもrss2htmlでかなり省略化できますので、何とか形にしたいですなw。

 

P.S.受信料は払いましょう。そして日経無料で読めるところだけの東日本版西日本版の全文RSSが完成しました。pubDateに対応していてくれれば完全に神でした、ぞうさん。ありがとうございます、キャッシュってこう書くのだと目から鱗です。どうせ、あっしは・・・キャッシュなんてOSの仕事だよっ!とのたまわっていたvbプログラマ(仮)ですよw。

広告
カテゴリー: 20世紀プログラマ, kindle タグ: パーマリンク

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト /  変更 )

Google フォト

Google アカウントを使ってコメントしています。 ログアウト /  変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト /  変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト /  変更 )

%s と連携中