Feed43 任意のページでRSSフィードを作成

ニュースサイトなどで特定のカテゴリだけのページのRSSを取得したいのにサイト全体のRSSしかなくて困ることが多かったのだが、独自のRSSフィードを作成できるFeed43で解決できた。
多少HTMLの知識が必要で取っつき難いものの、情報収集の効率が格段に上がるので使いこなせるようになれば様々なサイトで役立つはず。
Feed43: Convert web pages into professionally looking RSS feeds.
Offer your customers a convenient way to follow your news. Use Feed43 as a powerful information aggregation platform for your business. Or use Feed43 to streamline the way you read the news from websites you care about.

『Create your first RSS feed』をクリック。
◆Step 1. Specify source page address (URL)

RSSを取得したいページのURL(今回は当ブログのゲームカテゴリのページ)を入力し『Reload』。
ちなみに『Encoding』の方は何も入力しなくてもリロードすれば「Page loaded successfully (detected encoding: utf-8)」と出て一番無難なutf-8になるので空白のままでも構わない。
◆Step 2. Define extraction rules

入力したページのソースコードが表示される。このソースコードの中からRSSフィードに必要な記事タイトルとURLが含まれる繰り返し部分を探す必要がある。
Mery 自分好みにカスタマイズできる多機能テキストエディタ
今まではTeraPadだったが少々使いづらいと思うことが出てきたのでMeryに移行。多機能だが操作性はシンプルHTML、CSSなどを見やすく色分けUnicode対応タブ機能マクロ機能やプログラミングの入力補完など自分には必要なさそうな機能もあるけどWindows付属のメモ帳に+@した感じで使いやすい。個人的に重要なのが「文字列の検索で全ての文字列を強調表示できる」(画像のhtml部分)ことで今選択されている文字列だけ色を変えられるのも...

こんな感じに記事タイトルとURLが含まれる繰り返し部分が見つかるはず。どのあたりのタグが必要になるかはサイトによって違うので自分なりに頑張って探すしかない。
undefined
繰り返し部分の記事タイトルとURLを{%}に置き換える。更にソースの改行部分には{*}を入力。

『Item (repeatable) Search Pattern』に色々置き換えたソースコードを入力し、『Extract』をクリックすると「OK (10 items found)」と表示される。アイテム数はそのページの記事数によりけり。

『Clipped Data』に表示された記事のタイトルとURLを最初に入力したページの内容と比較して記事の数などが合っているか確認。
◆Step 3. Define output format
▼RSS feed properties

TitleとLinkは言わずもがな。Descriptionは別に必要ないかと思って空白のままにしていたらエラーが出たので適当に入力しておく。
▼RSS item properties

先程の『Clipped Data』に表示された{%1}{%2}をTitleとLinkに合わせてそれぞれ入力。
2021/03/26追記
サムネイルはItem Content Templateの枠に<img src="{%3}">といった簡単なimgタグで出力できると今更気付いた。どこのサイトも解説してなかったしてっきり無理なのかと…。

『Preview』をクリックするとフィードのプレビューが表示される。
◆Your feed is ready!

RSSフィードのURLが表示される。

そのURLを普段使っているRSSリーダーに読み込ませてちゃんと表示されるか確認できれば完了。
◆補足

サイトの構造によっては上手くRSSフィードを取得できないこともある。例えばAFPBB Newsのカテゴリ別ページのように最上部がカード型の最新5件でその下に6件目以降が表示されるような場合だとソースコードがバラバラで繰り返し部分を一纏めにできなかった。
6件目以降のソースコードは統一されているのでそこのRSSを取得するという手もある。最新ニュースの取得が少し遅れるがそこは仕方がない。
- 関連記事
-
-
動画からGIF画像を作成 2021/11/10
-
Amazonの検索結果からマケプレ商品を除外 2021/02/15
-
Feed43 任意のページでRSSフィードを作成 2019/08/13
-
Twitter検索でユーザー名に含まれる単語を除外 2019/06/10
-
IPv6アドレスによるインターネット接続 2017/02/02
-