用語集

ここでは、この文書全体で使う単語や用語の定義を述べる。

ラテン字

Bayes式フィルタ

[Bayesian Filters] [1] メッセージ間の語 (最近では語の組合せや句のこともある) の再現性に基づいて、 メッセージがスパムである確率を決定するフィルタ。

最初に、不要メール (スパム) と分かっているメッセージと真っ当なメール (非スパム) と分かっているメッセージを与えて、フィルタを鍛える。 各メッセージの語 (または句) ごとに、 特定の語句が非スパムとスパムのどちらにより多く現れるかを示す Bayes式得点が決まる。語は得点とともに Bayes式インデクスに蓄えられる。

このようなフィルタは、人間のプログラマが手作業で作成した キーワードに基づくフィルタでは見落とされてしまうようなスパムのしるしを 見つけ出すこともある。すくなくとも、そういう作業を自動化できる。

Bayes式語句インデクスは、明らかに、 鍛えるときに使ったメッセージの言語に特化してしまう。 さらに、ユーザ個々人にも特化してしまう。したがっておそらく、 システム全体のSMTPの時点での排除よりも、個人用のコンテンツフィルタ (例えばメール利用者エージェントでの) に適しているであろう。

そのうえ、スパム送信者は 簡易なBayes式フィルタを打ち破るテクニックを開発してきている。 でたらめな辞書単語や短いストーリーをメッセージに入れておくのである。 これは、Bayes式フィルタで決定されるスパム確率を下げるし、 長い目で見ればBayes式インデクスの質を落すことになる。

http://www.everything2.com/index.pl?node=Bayesian も見よ。

Request for Comments

(略称: RFC) http://www.rfc-editor.org/ より: " Request for Comments (RFC) 文書集は、 インターネットについての技術面や組織面の記述の集合である [...]。 RFC集の覚書では、コンピュータネットワーキングのさまざまな側面 (プロトコル、手続き、プログラム、概念などを含む) について論じられており、 さらに会議の記録、意見、あとたまに冗談などもある。 "

これらの文書が、 プロトコルやデータ形式の記述も含めたインターネット運営上の "掟" となっている。 メール配送に関わるものとしては、つぎのものがある:

  • RFC 2821 "簡易メール転送プロトコル" [Simple Mail transfer Protocol] と、

  • RFC 2822 "インターネットメッセージの形式" [Internet Message Format]。

エンヴェロープ受信者

[Envelope Recipient] メッセージが送られる先の電子メールアドレス。 SMTPトランザクションの間に、RCPT TO: コマンドを使って与えられる。 これは、メッセージそのものの "To:" ヘッダや "Cc:" ヘッダにあるアドレスとは違うこともある。

SMTPトランザクションも見よ。

エンヴェロープ送信者

[Envelope Sender] メッセージの送信者である電子メールアドレス。 SMTPトランザクションの間に、MAIL FROM: コマンドを使って与えられる。 これは、メッセージそのものの "From:" ヘッダにあるアドレスとは違うこともある。

特殊な場合として、配送状況通知 (バウンスしたメッセージ、 受け取り通知、不在メッセージ...) がある。このようなメールでは、 エンヴェロープ送信者は空である。 これはメールループを防止するためであり、 また一般にこういったものを "通常の" メールと区別できるようにするためである。

SMTPトランザクション も見よ。

開放型プロキシ

[Open Proxy] どこからのTCP/IP接続でも受け付け、 それをどこへでも転送できるプロキシ

スパム送信者やウィルスが悪用する。自分のIPアドレスを隠すのに使ったり、 複数のホストやネットワークを通じて転送負荷を分散させるのである。

ゾンビホストも見よ。

開放型リレー

[Open Relay] どこからのメールでも受け付け、 それをどこへでも転送できるリレー

1980年代には、公開されているSMTPサーバは、 実質的にはどれもが開放型リレーだった。メッセージはしばしば、 複数の第三者の計算機を渡り歩いてから目指す受信者にたどり着いていた。 今日では、真っ当なメールはほぼ例外なく、送信者の側の送出用メール転送エージェントから受信者のドメインの側の受入用メール交換機へ 直接送られている。

逆に、 いまだにインターネット上に存在する開放型リレーサーバは ほぼ例外なく、スパム送信者が自分の身許を隠したり 何万というメッセージを送る作業で負荷分散を実行したりするために悪用されている。 おそらくこれは、 DNSブロックリストがこういった計算機をすべて登録してしまうまでは続くであろう。

開放型リレーの防止についての議論も見よ。

完全修飾ドメイン名

[Fully Qualified Domain Name] (別名 "FQDN") 完全で、全地球的に一意な、 DNSドメインを含むインターネットでの名前。例えば: "www.yahoo.com"

FQDNがかならず単一のホストを指しているとは限らない。 例えば、"www" のような一般的なサービスの名前はしばしば 複数のIPアドレスを指している。これはサーバ間での負荷分散のためである。 とはいえ、どの計算機ではプライマリホスト名は かならずその計算機に固有のものである --- 例えば: "p16.www.scd.yahoo.com"

FQDNはかならずピリオド (".") を含む。 最初のピリオドよりも前の部分が非修飾名で、 これは全地球的に一意ではない。

偽陰性

[False Negative] 不要メール (スパム、ウィルス、マルウェア) が、 誤って真っ当なメールに選別されてしまった (そしてそのために、排除されなかった) もの。

偽陽性

[False Positive] 真っ当なメールが、誤って不要メールに選別されてしまった (そしてそのために、阻止されてしまった) もの。

巻き添え被害も見よ。

小額課金方式

[Micropayment Schemes] (別名 元払い方式 [sender pay schemes])。 メッセージの送信者は、メッセージの受信者各々について、 いくらか計算機の資源を費やして仮想的な切手を作成する --- 通常は、大量のメモリ読み書きを要するがCPU速度は相対的に速いような 数学的な問題を解くことになる。そして、この切手をメッセージのヘッダに付加する。 受信者のほうでは、この切手をより簡単なデコード操作で検証できるようになっている。

このアイディアではメッセージのすべての受信者アドレスごとに切手が必要になるので、 何千ものユーザに一度に送ろうとすると途方もなく "高くつく" ことになる。

このようなシステムが2つある:

スパムトラップ

[Spam Trap] 公開の場でアドレスを収集しているロボットをおびき寄せて DNSによるブラックリスト不要メールシグネチャ集積システムのような 協調型ツールで捕らえるための、 撒き餌にする電子メールアドレス。

このアドレスに送られてくるメールは通常、スパムかマルウェアである。 しかし、そのうちのあるものは巻き添えスパム --- つまり偽装された送信者アドレスに送られる配送状況通知 --- である。したがって、 スパムトラップがこのようなメッセージを無視する安全装置を具えていなければ、 結果としてツールは完全に信頼できるものではなくなるであろう。

ゾンビホスト

[Zombie Host] インターネット接続している計算機で、 大量メール送信型のウィルスやワームに感染しているもの。 このような計算機は、かならずと言っていいほど Microsoft® Windows® オペレーティングシステムの類を実行しているし、 ほぼかならず "常時接続" IPアドレスブロックにある。 持ち主は、計算機が感染していることに気づいていないか、 そもそもそんなことは気にしていないし、 しばしばISPの側も、それをシャットダウンさせるための行動を起こさない。

幸いなことに、"dul.dnsbl.sorbs.net" のようなさまざまなDNSブロックリストがあって、 このような "常時接続" アドレスブロックを収集している。 こういうブロックリストを使うと外部から来るメールを拒否することができる。 常時接続ユーザからの真っ当なメールは、通常、 ISPの "スマートホスト" を通じてやって来るものである。

ドメインネームシステム

[Domain Name System] (略称: DNS) インターネットのドメイン名についての情報を取得するための、事実上の標準。 このような情報の例としては、サーバのIPアドレス (いわゆる Aレコード)、 受入用メール交換機の割り当て (MXレコード)、一般的なサーバの情報 (SRVレコード)、 その他のテキスト情報 (TXTレコード) がある。

DNSは、階層型で分散型のシステムである --- 各々のドメイン名は、 一つまたはその以上のDNSサーバの組と関連づけられており、 このDNSサーバがドメインについての情報 (自身のサブドメインについてのネームサービスの委任状況も含む) を提供する

例えば、最上位ドメイン "org" は The Public Interest Registry が運用している --- このドメインの DNS サーバはドメイン名 "tldp.org" についての問い合わせを The Linux Documentation Project の特定のネームサーバに委任する。 そして、TLDPのネームサーバ (実は UNCが運用している) は第3階層のドメイン名 ("www.tldp.org" のような) についての問い合わせを、委任したりしなかったりする。

DNS検索は普通、転送ネームサーバを使って行なう。 このようなものはインターネットサービスプロヴァイダが (例えばDHCPによって) 提供する。

なりすましメール

[Joe Job] 別人の有効なアドレスから来たかのように見えるように作ってあるスパム。 これはしばしば、苦情の行き先を第三者に逸らしたり そのアドレスの持ち主にほかにも損害を与えようとする、 悪質な企みによるものである。

http://www.everything2.com/index.pl?node=Joe%20Job も見よ。

配送状況通知

[Delivery Status Notification] (略称: DSN) 送信者に送信したメッセージの状況について知らせるために MTA や MDAが自動的に作成するメッセージ (普通は、DSNの中に元のメッセージが含まれている)。 DSNでは例えば、 元メッセージが一時的あるいは恒久的な問題のために配送できなかったことや、 配送の試行がどのくらいの間続くのか、あるいは続かないのかを 送信者に知らせることができる。

配送状況通知は空のエンヴェロープ送信者アドレスから送られる。

プロキシ

[Proxy] 他の計算機に代わって働く計算機。 通常は、インターネットに向けて、あるいはインターネットから、 HTTP要求やTCP/IP接続などを転送したりする。 例としては、よく企業 --- ときには国家全体 --- で "Web プロキシ サーバ" を使って、 内部のネットワークから外部へ行くHTTP要求を、通したり通さなかったりしている。 これは、エンドユーザから見て透過的なこともそうでないこともある。

開放型プロキシリレー も見よ。

巻き添えスパム

[Collateral Spam] [2] 送信者アドレスが偽装されているメッセージ (多くがスパムやマルウェア) に対して、自動的に応答して送られるメッセージ。 巻き添えスパムの典型的な例としては、ウィルス検出報告 ("You have a virus") やその他の配送状況通知がある。

巻き添え被害

[Collateral Damage] 真っ当な送信者ホストが、DNSブロックリストへ登録されたために メッセージが阻止されてしまうこと。

一部のブロックリスト (SPEWS のような) は、 ISPが苦情に反応しないようだと そのISPのIPアドレス空間全体を機械的に登録してしまうので、 そのISPの顧客全員が影響を被ることになる。

偽陽性も見よ。

メール交換機

[Mail Exchanger] (略称: MX) インターネットドメインのメールを (送ったり) 受け取ったりするための専用の計算機。

通常、インターネットドメインのDNSゾーン情報には そのドメインの受入用メール交換機として働く完全修飾ドメイン名の一覧が含まれている。 このような一覧の各々を "MXレコード" と呼ぶ。 各々のレコードは、複数の "MXレコード" の間での "優先度" を示す数値を含む。最小の数値のものが最優先となり、 そのドメインの "プライマリのメール交換機" とみなされる。

メール転送エージェント

[Mail Transport Agent] (略称: MTA) インターネットドメインのメール交換機などのように、 メールサーバで動作しているソフトウェア。 メールを他のホストへ送信したり、他のホストから受信したりする。 よく普及しているMTAとしては、Sendmail, Postfix, Exim, Smail がある。

メール配送エージェント

[Mail Delivery Agent] (略称: MDA) ユーザのメールボックスが置かれている計算機で動作するソフトウェアで、 メールをそのメールボックスへ配送するもの。 MTA メール転送エージェントが配送を直接実行していることもよくあるが、 そういうMTAはMDAの役割も兼ね具えていることになる。 独立したメール配送エージェントの例としては、Deliver, Procmail, Cyrmaster および Cyrdeliver (Cyrus IMAP スイートに入っている) がある。

メール利用者エージェント

[Mail User Agent] (略称: MUA; 別名 メールリーダ [Mail Reader]) メールにアクセスし、ダウンロードし、読み、送るためのユーザソフトウェア。 例としては Microsoft Outlook/Outlook Express, Apple Mail.app, Mozilla Thunderbird, Ximian Evolution がある。

メールループ

[Mail Loop] 自動的に送られたあるメッセージが他のメッセージを発生させ、 そうした他のメッセージが直接あるいは間接に最初のメッセージを再び発生させ、 ということが続く状況。

メーリングリストで、 購読者のひとつがそのリストそのもののアドレスである場合を考えてみるとよい。 リストサーバはこのような状況に陥らないようにするため、よく メッセージヘッダに "X-Loop:" といったヘッダをつけ加えて すでにこのヘッダがあるメールは処理しないようにする。

同義語はリンギング [Ringing] である。

ラットウェア

[Ratware] スパム送信者が使っている大量メール送信型のウィルスや電子メールソフトウェア。 大量のメールを極めて短時間で送るれるように特別に作ってある。

多くのラットウェアの実装には、 最良の筋書きにそってメールを配送できるだけのSMTPクライアントのコードしか入っていない。 SMTP通信の中で、受信側ホストに偽の、あるいは不正確な情報を与えようとする。 コマンドを発行する前に受け手からの応答を待とうとしないし、 何秒か応答を受信できないと接続を切る。 一時的なエラーの場合に、通常の再送機構にのっとった振舞いをしない。

リレー

[Relay] 電子メールをインターネットから、あるいはインターネットへ転送する計算機。 リレーの例のひとつに "スマートホスト" がある。 これは、ISPが顧客に、外部へ行くメールを送信するために提供するものである。

開放型リレープロキシも見よ。

Notes

[1]

[訳注] 事後確率に関する "Bayesの定理" (1764) の応用であるため、 こう呼ばれる。

[2]

[訳注] backscatter mail (後方散乱メール --- とばっちりメール) とも言う。