フリーソフトやChrome拡張機能の使い方、ゲーム攻略、漫画感想など雑多な内容。

Feed43 任意のページでRSSフィードを作成

RSS アイコン
ニュースサイトなどで特定のカテゴリだけのページのRSSを取得したいのにサイト全体のRSSしかなくて困ることが多かったのだが、独自のRSSフィードを作成できるFeed43で解決できた。

多少HTMLの知識が必要で取っつき難いものの、情報収集の効率が格段に上がるので使いこなせるようになれば様々なサイトで役立つはず。

Feed43: Convert web pages into professionally looking RSS feeds.

Offer your customers a convenient way to follow your news. Use Feed43 as a powerful information aggregation platform for your business. Or use Feed43 to streamline the way you read the news from websites you care about.


Feed43 01
Create your first RSS feed』をクリック。




◆Step 1. Specify source page address (URL)

Feed43 02
RSSを取得したいページのURL(今回は当ブログのゲームカテゴリのページ)を入力し『Reload』。

ちなみに『Encoding』の方は何も入力しなくてもリロードすれば「Page loaded successfully (detected encoding: utf-8)」と出て一番無難なutf-8になるので空白のままでも構わない。




◆Step 2. Define extraction rules

Feed43 03
入力したページのソースコードが表示される。このソースコードの中からRSSフィードに必要な記事タイトルとURLが含まれる繰り返し部分を探す必要がある。


Mery 自分好みにカスタマイズできる多機能テキストエディタ

今まではTeraPadだったが少々使いづらいと思うことが出てきたのでMeryに移行。多機能だが操作性はシンプルHTML、CSSなどを見やすく色分けUnicode対応タブ機能マクロ機能やプログラミングの入力補完など自分には必要なさそうな機能もあるけどWindows付属のメモ帳に+@した感じで使いやすい。個人的に重要なのが「文字列の検索で全ての文字列を強調表示できる」(画像のhtml部分)ことで今選択されている文字列だけ色を変えられるのも...

当ブログのソースコードだと分かりづらいので下記で必要な箇所を抜粋。HTMLで色分けできるテキストエディタを使うと編集しやすくておすすめ。

Feed43 04
こんな感じに記事タイトルとURLが含まれる繰り返し部分が見つかるはず。どのあたりのタグが必要になるかはサイトによって違うので自分なりに頑張って探すしかない。

HTMLが見づらいならこのサイトを使うと楽。Indent TypeでTabを選んで整形すれば自動で見やすいHTMLに整形できる。


繰り返し部分の記事タイトルとURLを{%}に置き換える。更にソースの改行部分には{*}を入力。

Feed43 05
『Item (repeatable) Search Pattern』に色々置き換えたソースコードを入力し、『Extract』をクリックすると「OK (10 items found)」と表示される。アイテム数はそのページの記事数によりけり。

Feed43 06
『Clipped Data』に表示された記事のタイトルとURLを最初に入力したページの内容と比較して記事の数などが合っているか確認。




◆Step 3. Define output format

▼RSS feed properties
Feed43 07
TitleとLinkは言わずもがな。Descriptionは別に必要ないかと思って空白のままにしていたらエラーが出たので適当に入力しておく。

▼RSS item properties
Feed43 08
先程の『Clipped Data』に表示された{%1}{%2}をTitleとLinkに合わせてそれぞれ入力。

2021/03/26追記
サムネイルはItem Content Templateの枠に<img src="{%3}">といった簡単なimgタグで出力できると今更気付いた。どこのサイトも解説してなかったしてっきり無理なのかと…。

Feed43 09
Preview』をクリックするとフィードのプレビューが表示される。




◆Your feed is ready!

Feed43 10
RSSフィードのURLが表示される。

Feed43 11
そのURLを普段使っているRSSリーダーに読み込ませてちゃんと表示されるか確認できれば完了。




◆補足

Feed43 12
サイトの構造によっては上手くRSSフィードを取得できないこともある。例えばAFPBB Newsのカテゴリ別ページのように最上部がカード型の最新5件でその下に6件目以降が表示されるような場合だとソースコードがバラバラで繰り返し部分を一纏めにできなかった。

6件目以降のソースコードは統一されているのでそこのRSSを取得するという手もある。最新ニュースの取得が少し遅れるがそこは仕方がない。
関連記事