JP5584608B2

JP5584608B2 - 電子メールの誤送信の判定方法、判定プログラム、通信装置

Info

Publication number: JP5584608B2
Application number: JP2010283343A
Authority: JP
Inventors: 啓介小糸
Original assignee: Fujitsu Advanced Engineering Ltd
Current assignee: Fujitsu Advanced Engineering Ltd
Priority date: 2010-12-20
Filing date: 2010-12-20
Publication date: 2014-09-03
Anticipated expiration: 2030-12-20
Also published as: JP2012133474A

Description

本発明は、電子メールの誤送信を判定する方法に関する。

近年、情報の管理が強く求められるようになってきており、情報の流出を引き起こした企業は信用を失墜してしまう。近年、電子メールがビジネスなどで用いられるようになってきたことに伴って、電子メールの誤送信による情報の流出事故の件数も増加している。従って、電子メールの誤送信を防止することにより、情報の流出を防止することができると期待される。また、電子メールの誤送信等、インターネットを通じて情報が流出してしまった場合は情報の拡散の速度が速いことも指摘されていることからも、電子メールの誤送信を防ぎやすくするシステムが求められている。

関連する技術として、送信対象メールを語句に分解し、語句の出現頻度と未使用期間指数を用いて得られた誤送信指数に基づいて誤送信を検出するプログラムが知られている。また、宛先アドレスに有効ワードが含まれているかに基づいて、メールの転送の可否を判断するシステムが提案されている。さらに、送信先アドレスの正当性を検証する装置も知られている。この装置は、送受信された電子メールの累積送信回数を格納し、送信先アドレスの組み合わせごとの累積送信回数を基に送信先アドレスの組み合わせを並べ替えた後、送信先アドレスの組み合わせをユーザに提示する。

特開２００７−３４８２７号公報特開２００７−２７２３２３号公報特開２００７−１４８７８６号公報

ある語句について計算された誤送信指数を用いて誤送信を判定する方法では、多数のユーザによって使用されうる語句が判定に用いられると、誤送信を検出しづらくなるという問題がある。例えば、曜日や挨拶に用いる言葉など、ユーザによらずに良く用いられる語句を判定に用いた場合、その語句を含むメールの宛先アドレスや送信元アドレスの数が多いことが予測される。このような場合、語句が含まれているかを確認することにより、メールの送信先などが誤っているかを判定することは困難である。従って、多数のユーザに共通して用いられる語句の割合が多い電子メールは、宛先が誤っていたとしても誤送信であると判定されない恐れがある。

さらに、宛先アドレスに有効ワードが含まれているかにより転送の下記を判断するシステムや、宛先アドレスの組合せごとの累積送信回数に基づいて宛先アドレスを提示するシステムでは、メールの内容については判断されない。従って、例えば、有効ワードを含む宛先アドレスＡに、他の宛先に送信するつもりでユーザが作成したメールが送信される可能性があり、これらのシステムでは誤送信を検出できない場合がある。

本発明は電子メールの宛先が誤っているかの判定の精度を向上することを目的とする。

ある実施形態は、コンピュータに実行させる電子メールの誤送信の判定方法を提供する。コンピュータは、送信もしくは受信された電子メールに含まれている語句の出現頻度を、前記電子メールの宛先アドレスおよび送信元アドレスと対応付けて、語句データベースに記憶する。コンピュータは、送信される対象電子メールに含まれている語句のうちで、複数の電子メールに共通して用いられる語句を記録する共通語句データベースに含まれていない語句である対象語句を抽出すると共に、前記対象語句の総数を取得する。コンピュータは、前記対象語句の各々について、前記対象電子メールの宛先アドレスと対応付けて前記語句データベースに記憶されている前記出現頻度を第１の閾値と比較し、前記出現頻度が前記第１の閾値よりも大きい対象語句の数を取得する。さらに、コンピュータは、前記出現頻度が前記第１の閾値よりも大きい対象語句の数の前記総数に対する割合が第２の閾値未満の場合に、前記対象電子メールの送信は誤送信と判定する。

電子メールの宛先が誤っているかの判定の精度が向上する。

複数のユーザの間の通信で使用される語句の分布の例を説明する図である。通信装置の構成の一例を示す図である。語句データベースの例を示す図である。共通語句データベースの例を示す図である。関連性データベースの例を示す図である。辞書データの例を示す図である。通信装置のハードウェア構成の例を説明する図である。受信メールの分割方法の例を説明する図である。電子メール分割部の動作の例を説明するフローチャートである。語句データベースの更新方法の例を説明する図である。重み係数の算出方法の例を説明する図である。関連性データベースの更新に際して行われる動作の例を説明するフローチャートである。送信メールの分割方法の例を説明する図である。電子メール分割部と本文誤り判定部の動作の例を説明するフローチャートである。電子メール分割部と本文誤り判定部の動作の例を説明するフローチャートである。アドレス誤り判定部の動作の例を説明するフローチャートである。確認画面の例を示す。修正前語句テーブルの例を示す図である。ランク変更量テーブルの例を説明する図である。関連性データベースの更新に際して行われる動作の例を説明するフローチャートである。送信メールに基づくデータベースの更新方法の例を説明するフローチャートである。送信メールに基づくデータベースの更新方法の例を説明するフローチャートである。送信メールに基づくデータベースの更新方法の例を説明するフローチャートである。送信メールに基づくデータベースの更新方法の例を説明するフローチャートである。ランク変更量テーブルの例を説明する図である。修正前アドレステーブルの例を示す図である。第３の実施形態に係る関連性データベース更新部の処理の例を説明する図である。第３の実施形態に係る関連性データベース更新部の動作の例を説明するフローチャートである。第３の実施形態で行われるデータベースの更新方法の例を説明するフローチャートである。第３の実施形態で行われるデータベースの更新方法の例を説明するフローチャートである。第３の実施形態で行われるデータベースの更新方法の例を説明するフローチャートである。第３の実施形態で行われるデータベースの更新方法の例を説明するフローチャートである。第４の実施形態に係るネットワークの例を示す図である。第４の実施形態に係る誤送信判定装置の例を示す図である。送信メールが誤送信であると判定された場合のユーザへの通知方法の例を説明するフローチャートである。

以下、本実施形態について、図面を参照しながら詳細に説明する。
図１は、複数のユーザの間の通信で使用される語句の分布の例を説明する図である。図１（ａ）は、３人のユーザＡ〜Ｃが通信するときに用いられる語句の分布の例を示す。ユーザＡが用いる語句の集合をＷ１の円で示す。同様に、ユーザＢが用いる語句の集合をＷ２、ユーザＣが用いる語句の集合をＷ３の円で示す。ユーザＡとユーザＢは、お互いに電子メールの送受信などのコミュニケーションをとるときには、ユーザＡとユーザＢに共通した語句を用いる。そこで、ユーザＡとユーザＢの間で送受信される電子メールには、Ｗ１とＷ２の共通部分であるＷ１２とＷ１２３に含まれる語句が用いられると予測できる。同様に、ユーザＡとユーザＣの間で送受信される電子メールには、Ｗ１３とＷ１２３に含まれる語句が用いられると予測できる。さらに、ユーザＢとユーザＣの間で送受信される電子メールには、Ｗ２３とＷ１２３に含まれる語句が用いられると予測できる。ここで、Ｗ１２３に含まれている語句は、例えば、曜日などユーザＡ〜Ｃのいずれもが電子メールに記載する可能性がある語句である。すなわち、Ｗ１２３に含まれる語句は、ユーザＡがユーザＢ、Ｃのいずれに送信する電子メールに含まれていても良いため、Ｗ１２３の語句に基づいてユーザＡ〜Ｃのいずれに送信される電子メールであるかを判定することはできない。

そこで、ある実施形態に係る通信装置では、多数のユーザが共通して使用する語句（共通語句）を電子メールの宛先が適切であるかの判定に用いる語句から削除する。共通語句は、多数のユーザによって使用される語句であり、例えば、閾値以上の数のユーザによって使用されている語句とすることができる。共通語句の決定方法などについては後述する。図１の例では、共通語句はＷ１２３に含まれる語句であるとする。共通語句を除くと、図１（ａ）に示す語句の集合からＷ１２３に含まれる語句が除かれるので、コミュニケーションに用いられる語句は、図１（ｂ）に示すように分布する。従って、通信装置は、例えば、ユーザＡからユーザＢに送信される電子メールに、Ｗ１ｂとＷ２ｂの共通部分であるＷ１２の語句が含まれるかを確認する。ここでは、通信端末は複数のユーザ端末間でのメールの送受信を中継するサーバである場合を例として述べる。

まず、通信装置は、送受信が行われた電子メールに含まれている語句を、その電子メールが送受信されたユーザに対応付けて記憶する。例えば、Ｗ１２に含まれる語句をユーザＡとユーザＢに対応付けて記憶する。通信装置は、同様に、Ｗ１３に含まれる語句をユーザＡとユーザＣ、Ｗ２３に含まれる語句をユーザＢとユーザＣ、および、Ｗ１２３に含まれる語句をユーザＡ〜Ｃに対応付けて記憶する。

次に、通信装置が、送信元にユーザＡ、宛先にユーザＢが指定されており、宛先に送信される対象となっている電子メール（対象電子メール）を受信したとする。通信装置は、対象電子メールの本文を語句ごとに分割することにより、対象電子メールに含まれている語句を取得する。さらに、通信装置は、取得した語句からＷ１２３に含まれている語句を除いた語句を、処理の対象とする語句（対象語句）とする。ここで、通信装置は、予め、Ｗ１２３に含まれる語句を記録した共通語句データベースを記憶しているものとする。通信装置は、対象語句の各々について、Ｗ１２に含まれているかを確認することにより、ユーザＡとユーザＢとの間での通信に用いられる語句であるかを確認する。通信装置は、対象語句であり、かつ、Ｗ１２に含まれている語句の数を求める。Ｗ１２に含まれている対象語句の数が閾値を下回った場合、通信装置は、対象電子メールの送信は誤送信であると判定する。そこで、通信装置は、誤送信の警告をユーザＡに使用されている端末に通知する。

このように、ユーザによらずに良く用いられる語句を、誤送信の判定の際に用いないことにより、いずれのユーザにも用いられる語句の数を含めないで、対象電子メールの送信者と受信者との間で共通に用いられる語句の数を計数する。従って、いずれのユーザにも用いられる語句が多い電子メールについても、誤送信の可能性があるかを精度良く判定することができる。

＜装置構成＞
通信端末は、送受信を中継するサーバに限られず、例えば、ユーザ端末として実現される場合もある。以下、通信端末が、あるユーザの端末である場合について説明する。

図２は、通信装置１０の構成の一例を示す図である。通信装置１０は、受信部１１、送信部１２、電子メール作成部１３、電子メール分割部１４、送信確認部１５、タイマ１６、記憶部２０、判定部４０、および、データベース更新部５０を備える。判定部４０は、本文誤り判定部４１とアドレス誤り判定部４２を備える。記憶部２０は、語句データベース２１、共通語句データベース２２、関連性データベース２３、辞書データ３１、データ３２、および、プログラム３３を記憶している。データベース更新部５０は、語句データベース更新部５１、共通語句データベース更新部５２、および、関連性データベース更新部５３を備える。

通信装置１０は、受信部１１を介して、受信メールなどのデータを受信する。受信部１１は、受信した電子メールを電子メール分割部１４に出力する。通信装置１０は、送信部１２を介して、通信装置１０で生成されたデータなどを、通信装置１０の通信先の端末等に送信する。タイマ１６は、語句データベース更新部５１や関連性データベース更新部５３などの要求に応じて、時刻情報を通知する。

電子メール作成部１３は、電子メールの入力画面や宛先の選択画面などを、通信装置１０が備える表示部（図示せず）に表示する。また、適宜、電子メールの送信や受信に関する情報やエラーメッセージなどを、表示部に表示する。さらに、送信確認部１５から、電子メールの送信を要求されると、電子メール作成部１３は、送信が要求された電子メールを送信部１２に出力する。なお、電子メール作成部１３で生成された電子メールには、個々の電子メールを一意に識別することができる識別子が付されているものとする。識別子は、例えば、作成時刻を表す文字列や通し番号などとすることができる。電子メール作成部１３は、電子メール分割部１４に電子メールを出力するときに、その電子メールを識別する識別子を合わせて通知するものとする。

電子メール分割部１４は、通信装置１０が受信した電子メールや電子メール作成部１３で作成された電子メールを、複数のパラグラフに分割する。例えば、電子メール分割部１４は、電子メールを挨拶文、引用文、署名、本文の４つに分割することができる。さらに、電子メール分割部１４は、分割されたパラグラフごとに、含まれている語句を特定する。電子メール分割部１４は、通信装置１０が受信したメールを分割して得られた語句を、電子メールの送信元アドレスおよび宛先アドレスに対応付けて、語句データベース更新部５１に出力する。また、通信装置１０が受信したメールの送信元アドレスと宛先アドレスも、関連性データベース更新部５３に出力する。

一方、電子メール作成部１３で作成された電子メールを分割して得られた語句については、電子メール分割部１４は、電子メールの送信元アドレス、宛先アドレス、および、電子メールの識別子に対応付けて、本文誤り判定部４１に出力する。また、電子メール作成部１３で作成された電子メールの送信元アドレスと宛先アドレスを、電子メールの識別子に対応付けて、アドレス誤り判定部４２に出力する。電子メール分割部１４の動作については、後で詳しく説明する。

図３は、語句データベース２１の例を示す図である。語句データベース更新部５１は、電子メール分割部１４で特定された語句の各々を語句データベース２１に記録する。図３に示す例では、電子メール分割部１４に特定された語句は、その語句が含まれるパラグラフの種類、２つの電子メールアドレスの組み合わせ、ランク、更新日に対応付けて記録される。ここで、図３の例では、ある語句を含む電子メールの送信元アドレスと宛先アドレスの組み合わせに対応づけてその語句が登録され、２つのアドレスのうちのいずれが送信元アドレスであっても１つの情報に登録される。例えば、「迷惑メール」という語句がt-tanaka@xx-network.co.jpからsuzuki@ghi.co.jpに送信される電子メールに含まれている場合に、図３の矢印で示した情報が更新される。さらに、「迷惑メール」という語句がsuzuki@ghi.co.jpからt-tanaka@xx-network.co.jpに送信される電子メールに含まれている場合にも、図３の矢印で示した情報が更新される。

情報が更新される際には、ランクの値が変更される。ここで、ランクは、ある語句が送信元アドレスと宛先アドレスの間で送受信される電子メールに出現する可能性の大きさを表す数値であり、語句の出現頻度を示す数値でもある。ランクの決定方法や更新方法については後述する。なお、図３は、語句データベース２１の例であり、語句データベース２１に含まれる情報の種類などは、実装に応じて変更されることがある。

共通語句データベース２２は、図１のＷ１２３に含まれている語句のように、閾値以上の数のユーザに共通して用いられている語句を記録する。共通語句データベース２２は、前述のように、予め、通信装置１０に記憶されている場合もあるが、通信装置１０が生成することもできる。本実施形態では、共通語句データベース２２は、共通語句データベース更新部５２により生成され、更新もされるものとする。

共通語句データベース更新部５２は、例えば、語句データベース２１で対応付けられている宛先アドレスの数と送信元アドレスの数の合計が閾値よりも大きい語句を、共通語句データベース２２に記録する。図４は、共通語句データベース２２の例を示す図である。なお、図４は、共通語句データベース２２の例であり、実装に応じて、共通語句データベース２２に含まれる情報の種類は変更されることがある。例えば、共通語句データベース２２は、語句に対応付けて、その語句が含まれる電子メールの宛先アドレスの数と送信元アドレスの数の合計数を記録することもできる。共通語句データベース更新部５２は、語句データベース２１が更新されると、共通語句データベース２２を更新することができる。

本文誤り判定部４１は、共通語句データベース２２を参照することにより、電子メール分割部１４から入力された語句のうちで共通語句データベース２２に含まれていない対象語句を抽出する。さらに、対象語句の各々について、送信元アドレスと宛先アドレスに対応付けられているランクの値を語句データベース２１から取得し、取得したランクを第２の閾値と比較する。ここで、ランクが第２の閾値よりも大きい場合は、送信元アドレスと宛先アドレスの間で送受信される電子メール中に、その対象語句が含まれていることにより、そのメールが誤送信である可能性が小さくなることを示す。本文誤り判定部４１は、ランクの値が第２の閾値よりも大きい対象語句が、その電子メール中にいくつ含まれているかを計数する。第２の閾値よりもランクの値が大きい対象語句の値が、第３の閾値未満の場合、本文誤り判定部４１は、電子メールの文面から誤送信であると判定する。誤送信の可能性があると判定した場合、本文誤り判定部４１は、送信確認部１５に誤送信の可能性があることを通知する。一方、第２の閾値よりもランクの値が大きい対象語句の値が、第３の閾値よりも大きい場合、本文誤り判定部４１は、電子メールの文面から誤送信でないと判定する。すると、本文誤り判定部４１は、送信確認部１５に誤送信ではないという判定結果を通知する。本文誤り判定部４１は、後述するように、送信確認部１５から電子メールを送信した旨の通知を受けると、送信されたメールに含まれている対象語句を、送信元アドレスと宛先アドレスに対応付けて、データベース更新部５１に出力する。

図５は、関連性データベース２３の例を示す図である。図５の例では、関連性データベース２３には、２つのメールアドレスとそれらのメールアドレス間について計算された関連係数を記録している。ここで、関連係数は、２つのメールアドレスの間で電子メールが送受信される可能性を表すものとする。関連係数は０から１までの任意の数とすることができる。関連係数の計算方法と使用方法については、後述する。関連性データベース更新部５３は、電子メール分割部１４から通知されたアドレスから関連係数を計算し、関連性データベース２３に記録する。また、関連性データベース更新部５３は、関連性データベース２３を更新した履歴も関連性データベース２３に記録する。図５の例では、メールアドレスの組合せごとに、過去３回の送受信の記録が、関連性データベース２３に記録されている。

アドレス誤り判定部４２は、関連性データベース２３を参照することにより、電子メール分割部１４から入力された２つのアドレスの組合せに対応付けられた関連係数の大きさを関連閾値と比較する。ここで、関連閾値は、電子メール分割部１４から入力された２つのアドレスの間で電子メールの送受信が行われる可能性があるかを判定するための閾値であり、関連性が関連閾値以上の場合、電子メールの送受信が行われると判定される。例えば、関連閾値は、同一の電子メールが同報される可能性がある２つのアドレスに対応付けられる最小値に設定される場合がある。アドレス誤り判定部４２は、関連係数が関連閾値未満の値である場合、宛先アドレスが誤っていると判定する。複数のアドレスに同報される電子メールである場合は、個々の宛先アドレスについて判定が行われる。誤送信の可能性があると判定した場合、アドレス誤り判定部４２は、送信確認部１５に誤送信の可能性があることを通知する。一方、アドレス誤り判定部４２は、関連係数が関連閾値以上の値である場合、送信元アドレスおよび宛先アドレスに含まれているアドレスの組合せからは、誤送信であると判定しない。アドレス誤り判定部４２は、後述するように、送信確認部１５から、メールを送信した旨の通知を受け取ると、送信されたメールに含まれている送信元アドレスと宛先アドレスを、関連性データベース更新部５３に出力する。アドレス誤り判定部４２の動作については、後で詳しく説明する。

送信確認部１５は、本文誤り判定部４１やアドレス誤り判定部４２から、誤送信の可能性があると通知されると、通信装置１０の表示部（図示せず）に、エラーメッセージと送信を行うかの指示の入力を要求する確認画面を表示する。送信確認部１５は、確認画面を介して、ユーザからメールの送信を指示されると、指示された電子メールを宛先アドレスに送信し、送信したことを本文誤り判定部４１とアドレス誤り判定部４２に通知する。また、送信確認部１５は、本文誤り判定部４１とアドレス誤り判定部４２の両方が誤送信であると判定しない電子メールについて、その電子メールの送信を電子メール作成部１３に指示する。さらに、電子メールを送信したことを、その電子メールを識別する識別子と共に、本文誤り判定部４１とアドレス誤り判定部４２に通知する。

辞書データ３１は、電子メール分割部１４が電子メールを語句やパラグラフに分割する際に参照される。辞書データ３１は、語句に対応付けてその語句の品詞が記録されているものとする。さらに、人名や挨拶などのパラグラフ分割の判断材料となる語句も辞書データ３１に記録されているものとする。図６に辞書データ３１の例を示す。辞書データ３１は、任意の辞書データを用いることができ、例えば、ＩＰＡ（Information-technology Promotion Agency, Japan、情報処理推進機構）などで文書の解析用に作成されているデータを用いることができる。

通信装置１０は、さらに、記憶部２０に、データ３２とプログラム３３も記憶している。通信装置１０に備えられているCentral Processing Unit（ＣＰＵ、図７を参照）は、プログラム３３を読み込むことにより、受信部１１、送信部１２、電子メール作成部１３、電子メール分割部１４、送信確認部１５、判定部４０、および、データベース更新部５０として動作する。データ３２には、例えば、閾値の値、修正前語句テーブル（図１７）、ランク変更量テーブル（図１８）などが含まれるものとする。修正前語句テーブルとランク変更量テーブルについては後で詳しく説明する。また、記憶部２０は、適宜、通信装置１０の動作に用いられるデータなどを記録することができる。

図７は、通信装置１０のハードウェア構成の例を説明する図である。通信装置１０は、ＣＰＵ６１、メモリ６２、入力装置６３、出力装置６４、外部記憶装置６５、媒体駆動装置６６、ネットワーク接続装置６８、および、バス６９を備える。ＣＰＵ６１は、前述のとおり、受信部１１、送信部１２、電子メール作成部１３、電子メール分割部１４、送信確認部１５、判定部４０、および、データベース更新部５０として動作する。メモリ６２は、記憶部２０として動作する。

通信装置１０は、キーボードやマウスなどの入力装置６３を備える。ユーザは、入力装置６３を介して、電子メールを作成することができる。また、ユーザは、入力装置６３を介して、電子メールを送信するかの指示を入力することができる。通信装置１０は、ディスプレイなどの出力装置６４を備える。電子メール作成部１３は、電子メールの作成画面を出力装置６４に表示することができる。また、送信確認部１５は、出力装置６４にエラーメッセージや、電子メールの送信を行うかの指示をユーザに要求する確認画面を表示する。

外部記憶装置６５は、通信装置１０で用いられるデータを、適宜、記憶することができる。媒体駆動装置６６は、可搬記憶媒体６７を読み込むことにより、データやプログラムなどを取得する。通信装置１０は、媒体駆動装置６６を介して、可搬記憶媒体６７に記憶されているデータ等を取得することができる。ＣＰＵ６１は、可搬記憶媒体６７に格納されているプログラムを実行することにより、受信部１１、送信部１２、電子メール作成部１３、電子メール分割部１４、送信確認部１５、判定部４０、および、データベース更新部５０として動作する場合もある。この場合には、媒体駆動装置６６を介して、通信装置１０がプログラムを読み込む。なお、可搬記憶媒体６７は、例えば、Compact Disc Read Only Memory（ＣＤ−ＲＯＭ）、Universal Serial Bus（ＵＳＢ）メモリ、フラッシュメモリなどとすることができる。ネットワーク接続装置６８は、ネットワーク７０への接続処理を行う。

＜第１の実施形態＞
以下、第１の実施形態について説明する。通信装置１０は、通信装置１０の受信メールから語句やアドレスの関連性を学習して語句データベース２１や関連性データベース２３を作成し、得られたデータベースを用いて、通信装置１０で作成されたメールが誤送信であるかを判定する。誤送信ではないと判定した場合、通信装置１０は、送信メールからも、語句やアドレスの関連性を学習することにより、語句データベース２１や関連性データベース２３を更新する。誤送信であると判定した場合でも、ユーザから送信指示があると、通信装置１０は、送信メールを宛先アドレスに向けて送信する。さらに、ユーザからの送信指示があったメールについても、語句やアドレスの関連性を学習する。そこで、まず、受信メールからの学習について説明する。

〔受信メールからの学習〕
図８は、受信メールの分割方法の例を説明する図である。ここで、図８（ａ）の受信メールは、受信部１１を介して受信され、電子メール分割部１４に入力されたものとする。また、電子メール分割部１４には、受信部１１から受信メールの文面とともに、送信元アドレスと宛先アドレスが通知されているものとする。さらに、宛先アドレスの各々について宛先（Ｔｏ）と同報の宛先（ＣＣ、Carbon Copy）のいずれが指定されているかについても通知するものとする。例えば、図８の受信メールの場合、suzuki@ghi.co.jpは、Ｔｏに指定された宛先アドレスであることが通知され、sato@ghi.co.jpは、ＣＣが指定された宛先アドレスであることが電子メール分割部１４に通知される。以下、図８を参照しながら、受信メールの分割と、受信メールからの語句やアドレスの学習方法について説明する。

電子メール分割部１４は、入力された受信メールをパラグラフごとに分割する。例えば電子メール分割部１４は、２つの空白行の間にある文字列を、１つのパラグラフと判定することができる。図８（ａ）の例では、電子メール分割部１４は、受信メールをＰ１〜Ｐ８の８個のパラグラフに分割する。

次に、電子メール分割部１４は、パラグラフに含まれている文字列や記号などを用いて、パラグラフに記載されている内容を判定する。電子メール分割部１４は、各パラグラフに辞書データ３１で人名、挨拶として登録された語句、記号などが含まれているかと、それぞれが含まれている電子メール全体の中での位置を確認し、得られた結果に応じて、パラグラフに記載されている内容を判定する。例えば、電子メール分割部１４は、パラグラフに人名もしくは挨拶に用いられる語句が含まれていて、かつ、記号を含まないパラグラフを、挨拶文に分類する。また、パラグラフに含まれている行の最初の１文字が記号である場合、電子メール分割部１４は、そのパラグラフを引用に分類する。さらに、記号が複数連続して記載されていて、人名を含むパラグラフを、署名に分類する。最後に、挨拶文、引用、署名のいずれにも分類されていないパラグラフを、本文に分類する。

パラグラフの分類の例を、図８（ａ）の受信メールのパラグラフが分類される場合を例として説明する。電子メール分割部１４は、例えば、図６に示す辞書データ３１を参照することにより、パラグラフＰ１には、「鈴木」という人名が含まれているが記号を含んでいないと認識する。そこで、電子メール分割部１４は、パラグラフＰ１を挨拶文に分類する。さらに、パラグラフＰ２には、「田中」という人名と、「お世話になって」という挨拶語句が含まれている。そこで、電子メール分割部１４は、パラグラフＰ２も挨拶文に分類する。また、パラグラフＰ３、Ｐ４、Ｐ６、Ｐ７はいずれも、人名、挨拶に用いられる語句、記号を含まないので、本文に分類される。パラグラフＰ５は、行の最初が記号「＞」であるので、引用に分類される。パラグラフＰ８は、記号「−」が２つ以上連続した文字列を含み、「田中」という人名も含んでいるため、署名に分類される。従って、パラグラフＰ１〜Ｐ８は、図８（ｂ）のテーブルに示すように分類される。

図９は、電子メール分割部１４の動作の例を説明するフローチャートである。電子メール分割部１４は、電子メールの先頭にポインタを移動する（ステップＳ１）。次に、ポインタの現在の位置から、ポインタよりも後でポインタから最も近い空白行までをｓｔｒに取り出し、ポインタをその空白行の次の行に移動する（ステップＳ２、Ｓ３）。例えば、図８の例では、電子メール分割部１４は、電子メールの先頭から次の空白行Ｘまでを、パラグラフＰ１とし、ポインタをＸの次の行に移動する。次に、電子メール分割部１４は、ｓｔｒに取り出したパラグラフに挨拶に用いられる語句が含まれているかを確認する（ステップＳ４）。挨拶に用いられる語句が含まれていない場合、電子メール分割部１４は、パラグラフに人名が含まれているかも確認する（ステップＳ５）。パラグラフに人名が含まれていない場合、電子メール分割部１４は、パラグラフに含まれている行の最初の文字が記号であるかを確認する（ステップＳ６）。パラグラフに含まれている行の最初の文字が記号ではない場合、電子メール分割部１４は、そのパラグラフを「本文」に分類する（ステップＳ６でＮｏ、ステップＳ７)。一方、パラグラフに含まれている行の最初の文字が記号である場合、電子メール分割部１４は、そのパラグラフを「引用」に分類する（ステップＳ６でＹｅｓ、ステップＳ８)。また、挨拶に用いられる語句がパラグラフに含まれていることが場合、電子メール分割部１４は、そのパラグラフを「挨拶文」に分類する（ステップＳ４でＹｅｓ、ステップＳ１１）。挨拶に用いられる語句が含まれておらず、人名が含まれるパラグラフについては、電子メール分割部１４は、記号が複数連続した文字列が含まれているかを確認する（ステップＳ５でＹｅｓ、ステップＳ９)。記号が複数連続した「----」などの文字列が含まれている場合、電子メール分割部１４は、パラグラフを「署名」に設定する（ステップＳ９でＹｅｓ、ステップＳ１０）。一方、記号が複数連続した文字列が含まれていない場合、電子メール分割部１４は、パラグラフを「挨拶文」に設定する（ステップＳ９でＮｏ、ステップＳ１１）。さらに、電子メール分割部１４は、ポインタの位置が電子メールの末尾であるかを確認し、ポインタが電子メールの末尾に来るまでステップＳ２〜Ｓ１２を繰り返す（ステップＳ１２）。

次に、電子メール分割部１４は、各パラグラフを語句単位に分割する。このとき、電子メール分割部１４は、適宜、辞書データ３１を参照することができる。電子メール分割部１４は、分割した個々の語句を、その語句を含む電子メールの送信元アドレス、宛先アドレス、および、その語句が含まれていたパラグラフが分類された種類に対応付けて、語句データベース更新部５１に出力する。語句データベース更新部５１は、電子メール分割部１４から入力されたデータに基づいて、語句データベース２１に含まれているランクの値と更新日を変更する。

図１０は、語句データベース２１の更新方法の例を説明する図である。図１０の例では、語句データベース更新部５１は、送信元アドレスと宛先アドレスの関係に応じて、図１０（ａ）に示す加算値を、語句データベース２１に記録されているランクの値に加算するものとする。宛先アドレスが宛先Ｔｏに指定されている場合、ランクの加算値は３であり、宛先アドレスがＣＣに指定されている場合、ランクの加算値は２である。例えば、図８に示したメールの本文から「迷惑メール」という語句が特定されて、語句データベース更新部５１に出力されたとする。すると、語句データベース更新部５１は、図３に示した語句データベース２１のランクを図１０(ｂ)に示すように、変更する。また、語句データベース更新部５１は、タイマ１６に時刻情報を要求し、得られた時刻情報を更新日の欄に記録する。このように、受信メールから特定された語句について、送信元アドレスと宛先アドレスに対応付けられたランクの値が加算される。従って、ある語句のランクが正の値であることは、その語句と対応付けられているアドレスの組み合わせにおいて、その語句が使用されることが妥当であることを示す。

なお、語句データベース２１の更新方法は、実装に応じて変更することができる。例えば、語句データベース更新部５１は、前述の更新方法に加えて、さらに、特定のアドレスの間でよく用いられる語句について、他のアドレスでのランクの値を小さくすることもできる。この場合、語句データベース更新部５１は、更新を加えた語句について、語句データベース２１に登録されている全てのアドレスの組み合わせに対応付けられているランクの平均値（ランク平均値）を求める。ランク平均値が正であれば、語句データベース更新部５１は、ランク平均値と、ランクを更新したアドレスの組み合わせについての更新後のランクとの差を求める。得られた差が、予め記憶されている閾値を越えていた場合、語句データベース更新部５１は、ランクを加算したアドレスの組み合わせ以外の全てのアドレスに対して、その語句のランクを１減算する。

例えば、「ＩＭＡＰ」という語句について、ユーザＤとユーザＥのアドレスの組み合わせ、ユーザＥとユーザＦの組み合わせ、ユーザＧとユーザＨの組み合わせでのランクが、語句データベース２１に登録されているとする。また、ユーザＤがユーザＥから受信したメールに「ＩＭＡＰ」という語句が含まれているとする。この場合、語句データベース更新部５１は、ユーザＤとユーザＥのアドレスの組み合わせに対応付けられた「ＩＭＡＰ」のランクを加算する。次に、語句データベース更新部５１は、「ＩＭＡＰ」の登録のあるアドレスの組み合わせの全てについて登録されているランクの平均値（ランク平均値）を求める。ここで、ランク平均値が正であれば、ユーザＤとユーザＥのアドレスの組み合わせの「ＩＭＡＰ」のランクの値とランク平均値の差が閾値以上であるかが判定される。差が閾値以上であれば、「ＩＭＡＰ」という語句がユーザＤとユーザＥの間で使われる可能性は、ユーザＥとユーザＦの間、および、ユーザＧとユーザＨの間で使われる可能性よりも大きいと考えられる。そこで、語句データベース更新部５１は、「ＩＭＡＰ」という語句について、ユーザＥとユーザＦの組み合わせでのランクと、ユーザＧとユーザＨの組み合わせでのランクを、それぞれ１つずつ減算する。なお、データベース更新部５１は、ランク平均値が正のときにこの処理を行うことにより、特定のアドレス間でのある語句のランクの値が異常に大きな値もしくは小さな値となることを防いでいる。

語句データベース２１が予め決められた回数だけ更新されると、共通語句データベース更新部５２は、共通語句データベース２２を更新する。例えば、語句データベース２１が１００回更新されたときに、共通語句データベース更新部５２は、語句データベース２１を参照し、登録されている語句が何種類のアドレスに対応付けられているかを確認する。このとき、共通語句データベース更新部５２は、アドレス１とアドレス２のいずれに登録されていても、同一のメールアドレスは１種類と数えるものとする。また、ランクの値の大きさは参照しない。ある語句に対応付けられているアドレスの数が閾値よりも大きな値となると、共通語句データベース更新部５２は、その語句を共通語句データベース２２に登録する。一方、共通語句データベース２２に登録されている語句についても語句データベース２１を参照して、対応付けられているアドレスの数を確認する。対応付けられているメールアドレスの数が閾値未満になると、共通語句データベース更新部５２は、その語句を共通語句データベース２２から削除する。なお、共通語句データベース更新部５２が共通語句データベース２２を更新するまでに行われる語句データベース２１の更新の回数や、共通語句データベース更新部５２が用いる閾値の値は、実装に応じて任意に設定することができる。

次に、関連性データベース２３の更新について説明する。図８（ａ）に示す受信メールについて、電子メール分割部１４は、送信元アドレス、宛先アドレス、宛先アドレスの種類を関連性データベース更新部５３に通知する。関連性データベース更新部５３は、電子メール分割部１４から通知された情報を元にして、受信メールについてそれぞれのアドレスの関連性を計算する。アドレスの関連性は、受信したメールの各々から得られるアドレスの関連性と、各々の受信メールを受信した時刻から現在の時刻までの時間の長さとから算出される。例えば、ある受信メールにＪ個のアドレスが含まれているとする。この場合、関連性データベース更新部５３は、ｉ番目のメールアドレスとｊ番目のメールアドレスについての、その受信メールでの関連性（Ｒ_ｉｊ）を、次式から計算する。
Ｒ_ｉｊ＝Ｃｉ×Ｃｊ
ここで、Ｃｉはｉ番目のメールアドレスの区分係数であり、Ｃｊはｊ番目のメールアドレスの区分係数である。区分係数は、メールアドレスが送信元アドレス、Ｔｏに指定された宛先アドレス、ＣＣで指定された宛先アドレスのいずれであるかによって決定される値である。以下の説明では、区分係数は次のとおりであるとする。なお、区分係数の値は実装に応じて任意に変更することができる。
送信元アドレス（Ｆｒｏｍ）の区分係数：１
宛先アドレス（Ｔｏ）の区分係数：１
宛先アドレス（ＣＣ）の区分係数：０．５

例えば、図８（ａ）の電子メールについて、関連性データベース更新部５３は、１番目のメールアドレスをt-tanaka@xx-network.co.jp、２番目のメールアドレスをsuzuki@ghi.co.jpに設定したとする。すると、通知されたアドレスの１番目のメールアドレスが送信元アドレスで、２番目のメールアドレスがＴｏに指定された宛先アドレスであるので、関連性を次のように計算することができる。
Ｒ１２＝１×１＝１

関連性データベース更新部５３は、受信メールから算出した関連性の値を用いて、関連性を算出したアドレスの間の記録を更新する。このとき、過去の送信履歴を関連性に反映させるために、処理対象のアドレスの組み合わせについて以下の式から算出される加重平均値を関連性データベース２３に記録する。
Ｒ_ｉｊ×Ｗ_ｃａｌ＋Ｒ_{ｉｊ＿ｄａｔａ}×Ｗ_ｄａｔａ・・・（１）
ここで、Ｒ_{ｉｊ＿ｄａｔａ}は関連性データベース２３に登録されている関連性の値であり、Ｒ_ｉｊは処理対象の受信メールに基づいて算出された関連性の値である。また、Ｗ_ｄａｔａは、関連性データベース２３に記録されている関連性の値の重み係数であり、Ｗ_ｃａｌは、処理対象の受信メールに基づいて関連性データベース更新部５３が算出した関連性の値の重み係数である。関連性データベース更新部５３は、処理対象のアドレスの組み合わせで電子メールの送受信が行われた頻度と、最終の送受信が行われてから現在までの時間を用いて、以下のように、重み係数を算出する。
Ｗ_ｃａｌ＝Ｔ１／（Ｔ１＋Ｔ２）
Ｗ_ｄａｔａ＝Ｔ２／（Ｔ１＋Ｔ２）
ここで、Ｔ１は、処理対象の２つのアドレスの間で行われた電子メールの送受信のうち、関連性データベース２３に記録されている最新の送受信が行われた時刻から、現在の時刻までの時間である。Ｔ２は、関連性データベース２３に記録されている最新の送受信から一定の回数前の送受信までの間に、処理対象の２つのアドレスの間で行われた送受信の平均周期を表す。

図１１は、重み係数の算出方法の例を説明する図である。図１１を参照しながら、処理対象のアドレスの間でＮ回目の電子メールの送受信が行われた場合の重み係数の計算について述べる。関連性データベース２３には、１〜Ｎ−１回の電子メールの送受信から求められた関連性が記録されているとする。また、図５に示すように、関連性データベース２３には過去３回の電子メールの送信履歴が記録されているとする。すなわち、Ｎ−１回目からＮ−３回目の送受信が行われた時刻が関連性データベース２３に記録されているものとする。以下、処理対象のメールアドレスがt-tanaka@xx-network.co.jpとsuzuki@ghi.co.jpである場合について述べる。

図１１に示すように、Ｎ回目のメールの送受信が２０１０年７月９日に行われたとする。Ｎ−１回目のメールの送受信が２０１０年７月５日であると、Ｔ１は４日間である。さらに、Ｎ−２回目とＮ−３回目の送受信は、２０１０年７月２日と２０１０年７月１日に行われているので、Ｎ−１回目の送受信からＮ−２回目の送受信までの期間は３日、Ｎ−２回目の送受信からＮ−３回目の送受信までの期間は１日である。従って、Ｎ−１回目からＮ−３回目の送受信までの送受信の平均周期は、２日であり、Ｔ２は２日になる。すると、重み係数は以下のようになる。
Ｗ_ｃａｌ＝４日／（２日＋４日）＝２／３
Ｗ_ｄａｔａ＝２日／（２日＋４日）＝１／３

処理対象のメールアドレスについて関連性データベース２３に記録されている関連性の値（Ｒ_{ｉｊ＿ｄａｔａ}）は、０．７５である。そこで、次式から、関連性の更新値が求められる。
Ｒ_ｉｊ×Ｗ_ｃａｌ＋Ｒ_{ｉｊ＿ｄａｔａ}×Ｗ_ｄａｔａ＝１×２／３＋０．７５×１／３＝０．９２

重み係数は、関連性データベース２３に登録されている関連性と、新たに受信したメールから得られた関連性のどちらに重点をおいて関連性データベース２３を更新するかを示す係数である。この例では、平均送受信周期よりも、最終の送受信時刻から現在までの期間が長い場合には、新たに学習した関連性の重みを強くしている。一方、最終の送受信時刻から現在の期間までの時間が平均送受信周期よりも短い場合、データベースに登録された関連性の重みを強くしている。なお、重み係数の設定方法は、一例であり、実装に応じて、様々に変更することができる。

図１２は、関連性データベース２３の更新に際して行われる動作の例を説明するフローチャートである。このフローチャートでは、ｉ、ｊの２つの変数が用いられ、ｉとｊはいずれも正の整数である。受信部１１を介して電子メールが受信されると、電子メール分割部１４から受信されたメールに含まれるアドレスの情報が関連性データベース更新部５３に通知される(ステップＳ２１）。関連性データベース更新部５３は、送信元アドレス、Ｔｏに指定された宛先アドレス、ＣＣに指定された宛先アドレスの総数Ｊを取得する(ステップＳ２２）。関連性データベース更新部５３は、変数ｉを１に設定し、ｊをｉより１つ大きい数に設定する（ステップＳ２３、Ｓ２４）。関連性データベース更新部５３は、Ｊ個のアドレスのうちのｉ番目のメールアドレスとｊ番目のメールアドレスの区分係数の積を求め、ｉ番目のメールアドレスとｊ番目のメールアドレスの組み合わせについて、関連性データベース２３を更新する（ステップＳ２５、Ｓ２６）。その後、関連性データベース更新部５３は、ｊの値を１だけインクリメントし、ｊがＪより大きい値であるかを確認する（ステップＳ２７、Ｓ２８）。関連性データベース更新部５３は、ｊがＪより大きい値になるまで、ステップＳ２５〜Ｓ２８を繰り返す。ｊがＪより大きくなると、関連性データベース更新部５３は、ｉの値を１だけインクリメントし、ｉの値がＪ−１よりも大きいかを確認する（ステップＳ２９、Ｓ３０）。ｉの値がＪ−１よりも大きくなるまで、関連性データベース更新部５３は、ステップＳ２４〜Ｓ３０の処理を繰り返す。

〔送信メールの誤送信判定〕
次に、送信メールについて行われる誤送信かの判定について説明する。送信メールは、電子メール作成部１３で生成され、ユーザから送信の指示が出されたものとする。送信メールには、送信メールを識別する識別子８１、および、送信元アドレスや宛先アドレスなどのアドレス情報８２が付加されている。図１３（ａ）に、電子メール作成部１３で生成された送信メールの例を示す。電子メール作成部１３は、送信の指示を取得すると、送信メールのデータを識別子と共に電子メール分割部１４に出力する。ここでは、送信メールに「２０１００７０９１０００」という識別子が付されているものとする。

電子メール分割部１４は、電子メール作成部１３から入力された送信メールを、受信メールと同様に分割する。図１３（ａ）の例では、送信メールは、パラグラフＰ１１〜Ｐ１６に分割されたものとする。また、図９を参照しながら説明した方法により、図１３（ｂ）に示すように、各パラグラフが分類されているものとする。電子メール分割部１４は、送信メールに含まれる各パラグラフを分類すると、パラグラフごとに、含まれている語句を特定する。電子メール分割部１４は、特定した語句を、送信メールの識別子、パラグラフの種類、送信元アドレス、宛先アドレス、各宛先アドレスの種類に対応付けて、本文誤り判定部４１に出力する。本文誤り判定部４１は、電子メール分割部１４から送られたデータを記憶部２０に記憶する。

本文誤り判定部４１は、共通語句データベース２２を参照して、「本文」または「引用」に分類されたパラグラフに含まれている語句について対象語句を求める。本文誤り判定部４１は求めた対象語句が、送信元アドレスと宛先アドレスの間で送受信された過去の電子メールに含まれているかを確認する。電子メールが２人のユーザの間で繰り返し送受信されている場合、送信者と受信者との間で共通のテーマについて連絡を取り合っていることが考えられる。従って、宛先メールアドレスが誤っていない場合、送信メールには、過去に送信者と受信者の間で送受信された電子メールに含まれていた対象語句が含まれている可能性が高い。

例えば、図８（ａ）の受信メールで引用されているパラグラフＰ５は、株式会社ＧＨＩの鈴木氏からＸＸネットワーク株式会社の田中氏に送られた電子メールの一部であるとする。田中氏からの返信には、図８（ａ）のパラグラフＰ３などに示すように、ＩＭＡＰサーバの回線速度についての記載が含まれている。さらに、図８（ａ）の受信メールには「迷惑メールフィルタ」や「迷惑メール」などの対象語句が含まれている。図８（ａ）の受信メールに対する返信が図１３（ａ）であるとすると、図１３（ａ）の送信メールには、図８（ａ）のメールに含まれている「迷惑メールフィルタ」などの対象語句が含まれていることが考えられる。

そこで、本文誤り判定部４１は、送信メールの「本文」または「引用」に分類されたパラグラフに含まれている対象語句が語句データベース２１に含まれているかを確認する。なお、ここで、語句データベース２１のうち、処理対象のメールの送信元メールアドレスと宛先メールアドレスに対応付けられている語句が対象語句と比較される。本文誤り判定部４１は、各パラグラフについて含まれている対象語句のうち、語句データベース２１のランクの値が閾値以上である対象語句の数を確認する。本文誤り判定部４１は、各パラグラフについて含まれている対象語句のうち、処理対象のメールの送信元メールアドレスと宛先メールアドレスに対応付けられているランクの値が閾値以上である対象語句の数（Ｔ）を求める。さらに、本文誤り判定部４１は、求めた対象語句の数Ｔと対象語句の総数の比を求める。得られた比が許可閾値（Ｔｈ_ＯＫ）以上である場合、本文誤り判定部４１は、そのパラグラフからは誤送信ではないと判定する。なお、本文誤り判定部４１は、予め、ランクの値と比較される閾値や許可閾値を記憶しているものとする。送信メールに含まれているいずれのパラグラフからも、誤送信でないと判定されると場合、本文誤り判定部４１は、誤送信ではないと判定する。一方、１つ以上のパラグラフで誤送信と判定されると、本文誤り判定部４１は、その送信メールについて誤送信であると判定する。

なお、以上の説明は、本文誤り判定部４１の動作の一例について述べており、本文誤り判定部４１の動作は、実装に応じて変形されることがある。例えば、本文誤り判定部４１は、許可閾値の代わりに、エラー閾値（Ｔｈ_ＮＧ）を記憶する場合もある。この場合、本文誤り判定部４１は、各パラグラフについて含まれている対象語句の総数と、語句データベース２１に含まれているランクが閾値未満の対象語句の数との比がエラー閾値以上である場合、本文誤り判定部４１は、そのメールが誤送信であると判定する。なお、本文誤り判定部４１は、語句データベース２１に含まれていない対象語句のランクを０とするものとする。さらに、本文誤り判定部４１は、許可閾値とエラー閾値を併用して誤送信の判定を行うこともできる。

図１４Ａと図１４Ｂは、電子メール分割部１４と本文誤り判定部４１の動作の例を説明するフローチャートである。図１４ＡのステップＳ４１、Ｓ４２、Ｓ４４、Ｓ４５は電子メール分割部１４の動作である。また、ステップＳ４３とＳ４６〜Ｓ５８は、本文誤り判定部４１の動作である。図１４Ａ、図１４Ｂのフローチャートには、定数Ｎ、Ｍが含まれる。ここで、Ｎは送信メールに含まれるパラグラフの総数、Ｍはあるパラグラフに含まれる対象語句の数である。また、図１４Ａ、図１４Ｂのフローチャートでは、ｎ、ｍ、ｔ、ｆの４つの変数が用いられる。ｎとｍは正の整数であり、ｔとｆは０か正の整数である。ｎは電子メール作成部１３が処理したパラグラフの計数に用いられる変数であり、ｍは電子メール作成部１３が処理した対象語句の数を計数に用いられる変数である。また、ｔは、ランクの値が閾値以上の対象語句の数を計数するために使用される変数、ｆは、ランクの値が閾値未満の対象語句の数を計数するための変数である。図１４Ａ、図１４Ｂの例では、閾値が１の場合について示す。すなわち、ランクが正の値の対象語句が１つ処理されるとｔが１つ加算され、ランクが０か負の値の対象語句が処理されるとｆが１つ加算される。

電子メール分割部１４は、パラメータ設定部１３から送信メールを受信すると、送信メールをパラグラフごとに分類する（ステップＳ４１、Ｓ４２）。電子メール分割部１４は、送信メールに含まれるパラグラフの総数Ｎを取得し、本文誤り判定部４１に通知する。

本文誤り判定部４１は、変数ｎとｍを１に設定し、ｔとｆを０に設定する（ステップＳ４３）。電子メール分割部１４は、電子メール分割部１４からｎ番目のパラグラフを取得すると、そのパラグラフが「本文」か「引用」のいずれかに分類されているかを確認する（ステップＳ４４）。取得したパラグラフが「本文」か「引用」に分類されていない場合、そのパラグラフについての処理を行わずに次のパラグラフを処理する（ステップＳ４４でＮｏ、ステップＳ５６）。従って、例えば、電子メール分割部１４は、Ｐ１１についての処理を行わずに、パラグラフＰ１２を処理対象とする。パラグラフＰ１２も、図１３（ｂ）に示すように「挨拶文」に分類されているため、電子メール分割部１４は、パラグラフＰ１２の処理を行わずに、パラグラフＰ１３を処理対象とする。

「本文」もしくは「引用」に分類されたパラグラフの情報を取得すると、電子メール分割部１４は、そのパラグラフを語句に分割する（ステップＳ４５）。電子メール分割部１４は、分割して得られた語句を本文誤り判定部４１に出力する。本文誤り判定部４１は、共通語句データベース２２を参照し、入力された語句から共通語句データベース２２に含まれている語句を削除する。本文誤り判定部４１は、残った名詞を対象語句とする。また、本文誤り判定部４１は、そのパラグラフに含まれている対象語句の数Ｍを求める（ステップＳ４６）。本文誤り判定部４１は、対象語句が１つ以上含まれている場合、ｍ番目の語句について、宛先アドレスと送信元アドレスの組み合わせに対応付けられているランクの値が正の値であるかを確認する（ステップＳ４７でＹｅｓ、ステップＳ４８）。確認されたランクの値が０か負の値であれば、本文誤り判定部４１は、変数ｆを１つインクリメントする（ステップＳ４９）。一方、確認されたランクの値が正の数であれば、本文誤り判定部４１は、変数ｔを１つインクリメントする（ステップＳ５０）。変数ｔもしくはｆのいずれかがインクリメントされると、本文誤り判定部４１は、変数ｍを１つインクリメントし、ｍの値をＭと比較する（ステップＳ５１、Ｓ５２）。ｍがＭより大きくなるまで、本文誤り判定部４１は、ステップＳ４８〜Ｓ５２を繰り返す。例えば、Ｐ１３の処理において、ｍ＝１のときに、本文誤り判定部４１は、「ゲートウェイ」を対象語句としたとする。「ゲートウェイ」という語句は図３の語句データベース２１では、ランクの値が正である。そこで、本文誤り判定部４１は、ｔを１インクリメントする。

処理対象のパラグラフに含まれている対象語句についての処理が終了すると、本文誤り判定部４１は、そのパラグラフの処理結果に基づいて誤送信かを判定する。図１４のフローチャートでは、本文誤り判定部４１は、変数ｆとＭの比がエラー閾値（Ｔｈ_ＮＧ）以上であるかを判定する（ステップＳ５３）。ここで、変数ｆとＭの比は、対象語句の総数に対する、送信元アドレスと宛先アドレスの間で送受信されたことがない対象語句の数の割合である。変数ｆとＭの比がエラー閾値以上の場合、本文誤り判定部４１は、本文に誤りがあると判定して、その送信メールの処理を終了する（ステップＳ５５）。

一方、変数ｆとＭの比がエラー閾値（Ｔｈ_ＮＧ）未満の場合、さらに、変数ｔとＭの比が許可閾値以上であるかを判定する（ステップＳ５４）。ここで、変数ｔとＭの比は、対象語句の総数に対する、送信元アドレスと宛先アドレスの間で送受信されたことがある対象語句の数の割合である。変数ｔとＭの比がＴｈ_ＯＫより小さい場合、本文誤り判定部４１は、本文に誤りがあると判定してその送信メールの処理を終了する（ステップＳ５５）。一方、ｆ／ＭがＴｈ_ＮＧ未満で、かつ、ｔ／ＭがＴｈ_ＯＫ以上の場合、本文誤り判定部４１は、ｎの値を１つインクリメントして、次のパラグラフを処理する。このとき、ｍ＝１に設定すると共に、ｔとｆの値を０に設定する（ステップＳ５６）。さらに、本文誤り判定部４１は、ｎの値をＮと比較し、ｎがＮより大きくなるまで、ステップＳ４４〜Ｓ５７を繰り返す（ステップＳ５７）。ステップＳ５７でｎがＮより大きいと判定されると、本文誤り判定部４１は、送信メールが誤送信ではないと判定する（ステップＳ５８）。なお、ステップＳ４７でＭが０個である場合、本文誤り判定部４１はステップＳ４８〜Ｓ５４の処理を行わずにステップＳ５６の処理を行う。

次に、アドレス誤り判定部４２による誤送信の判定について説明する。アドレス誤り判定部４２は、送信元アドレスから宛先アドレスにメールが送信される可能性を確認する。さらに、宛先アドレスが複数含まれている場合、アドレス誤り判定部４２は、宛先アドレスの間の関連性に基づいて、電子メールが同報される可能性があるかを確認する。アドレス誤り判定部４２は、送信メールの宛先に記載されているアドレスか送信元アドレスに指定されているメールアドレスから２つのメールアドレスを組み合わせ、各々の組み合わせについて関連性の大きさを確認して、誤送信の可能性があるかを判定する。ここで、アドレス誤り判定部４２は、送信元アドレスから宛先アドレスに電子メールが送られる可能性を、関連性データベース２３に記録されている関連性の値であるとする。

過去に電子メールの送受信が行われている電子メールアドレス間では、メールの送受信が繰り返される可能性が大きいと考えられる。例えば、図８（ａ）のメールは、t-tanaka@xx-network.co.jpからsuzuki@ghi.co.jpに送信されている。従って、図８（ａ）の電子メールに対する返信や追加の情報を含むメールなどがt-tanaka@xx-network.co.jpとsuzuki@ghi.co.jpの間で送受信される可能性は高いと考えられる。例えば、アドレス誤り判定部４２は、関連閾値を記憶している。関連閾値は、０から１までの間の任意の値とすることができるが、アドレス誤り判定部４２が誤送信を正しく検出できる程度に実装に応じて調整される。以下の説明では、例えば、アドレス誤り判定部４２は、関連閾値を０．５に設定されているものとする。一方、例えば、電子メールの送受信の履歴がないアドレスに向けて電子メールの送信が指示された場合、アドレス誤り判定部４２は、誤送信の可能性があると判定する。

図１３（ａ）に示すメールに含まれているアドレスが通知された場合のアドレス誤り判定部４２の動作について説明する。図１３（ａ）に示すメールが作成されると、アドレス誤り判定部４２には、以下の３つのアドレスが通知される。
送信元アドレス：suzuki@ghi.co.jp
Ｔｏに指定された宛先アドレス：t-tanaka@xx-network.co.jp
ＣＣに指定された宛先アドレス：sato@ghi.co.jp
そこで、アドレス誤り判定部４２は、関連性データベース２３を参照して関連性の値を取得する。ここでは図５に示す関連性データベース２３が用いられるものとする。すると、関連性データベース２３にt-tanaka@xx-network.co.jpとsato@ghi.co.jpの関連性は記録されていないので、アドレス誤り判定部４２は、関連性の値を０とする。得られた関連性の値を関連閾値と比較すると、t-tanaka@xx-network.co.jpとsato@ghi.co.jpの関連性は関連閾値より小さい。

次に、アドレス誤り判定部４２は、署名の関連性を検討する。メールの送信者がメールを同報する場合、送信者と同報メールの受取人は、同報メールの内容に関連する業務を行っている可能性が高い。署名の欄には、会社名、部署名、グループ名などが記載されている。従って、アドレス同士の関連性が小さくても、会社名、部署名、グループ名が送信者と共通している場合、宛先は誤っていない可能性がある。そこで、アドレス誤り判定部４２は、語句データベース２１を参照して、関連性が小さいと判定された組み合わせに含まれるアドレスに対応付けて記録されている語句を取得する。アドレス誤り判定部４２は、取得した対象語句同士を比較して、共通している語句の数を計数する。アドレス誤り判定部４２は、共通している語句の数を、宛先類似閾値と比較する。共通する語句の数が宛先類似閾値以上の場合、署名が類似していると判定する。署名が類似している場合は、関連性が関連閾値よりも小さくても、アドレス誤り判定部４２は、アドレスに誤りがあると判定しない。一方、関連性が関連閾値よりも小さく、さらに、署名が類似していない場合は、アドレス誤り判定部４２は、宛先が誤っている可能性があると判定する。

例えば、アドレス誤り判定部４２は、t-tanaka@xx-network.co.jpに関連付けられたメールの署名から得られた対象語句を取得する。図８に示した語句データベース２１が用いられている場合、t-tanaka@xx-network.co.jpに関連付けて「ＸＸネットワーク」、「田中」、「太郎」、「サポート部」、「03-1122-3344」、「1234-5678」の６種類の語句が記録されている。また、アドレス誤り判定部４２は、sato@ghi.co.jpに対応付けられたメールの署名欄から得られた対象語句も取得する。例えば、sato@ghi.co.jpに対応付けて「サポート部」、「ＧＨＩ株式会社」、「佐藤」の３種類の語句が記録されていたとする。この場合、t-tanaka@xx-network.co.jpとsato@ghi.co.jpの両者に対応付けられた語句のうちでは、「サポート部」が共通する。従って、共通する語句の数は１つである。類似閾値が３であるとすると、アドレス誤り判定部４２は、t-tanaka@xx-network.co.jpとsato@ghi.co.jpの署名の類似性は低いと判定し、さらに、送信メールの宛先が誤っている可能性があると判定する。

図１５は、アドレス誤り判定部４２の動作の例を説明するフローチャートである。以下、図１５を参照しながら、アドレス誤り判定部４２の動作について説明する。アドレス誤り判定部４２は、電子メール分割部１４から送信メールの送信元アドレスと宛先アドレスを取得する（ステップＳ６１）。ここで、送信元アドレスと宛先アドレスの合計数は、Ｋ個であるとする。アドレス誤り判定部４２は、変数ｐを１に設定する（ステップＳ６２）。さらに、アドレス誤り判定部４２は、変数ｑをｐよりも１つ大きな値に設定する（ステップＳ６３）。アドレス誤り判定部４２は、ｐ番目のメールアドレスとｑ番目のメールアドレスについて、関連性データベース２３を参照して、関連性の値を取得する（ステップＳ６４）。アドレス誤り判定部４２は、得られた関連性を関連閾値と比較する（ステップＳ６５）。関連性が関連閾値以上の場合、アドレス誤り判定部４２は、ｑの値を１つインクリメントしてＫと比較する（ステップＳ６５〜Ｓ６７）。ｑの値がＫよりも大きくなるまで、アドレス誤り判定部４２は、ステップＳ６４〜Ｓ６７を繰り返す。

一方、ステップＳ６５において、ｐ番目のメールアドレスとｑ番目のメールアドレスの組み合わせについて関連性データベース２３に記録されている関連性が、関連閾値よりも小さいと判定されると、アドレス誤り判定部４２は、語句データベース２１を参照する。アドレス誤り判定部４２は、語句データベース２１からｐ番目のメールアドレスと「署名」に対応付けられている語句を取得する。さらに、アドレス誤り判定部４２は、語句データベース２１からｑ番目のメールアドレスと「署名」に対応付けられている語句を取得する（ステップＳ６８）。アドレス誤り判定部４２は、各々のメールアドレスに対応付けられた語句を比較して、共通している語句の数を計数する。アドレス誤り判定部４２は、共通している語句の数が、宛先類似閾値以上の場合、署名が類似していると判定する（ステップＳ６９）。一方、アドレス誤り判定部４２は、共通している語句の数が、宛先類似閾値よりも少ない場合、署名が類似していないと判定し、誤送信の恐れがあると判定して処理を終了する（ステップＳ６９、Ｓ７０）。

変数ｑの値がＫより大きくなるまで、誤送信の恐れがあるメールアドレスの組み合わせが検出されなかった場合、アドレス誤り判定部４２は、ｐの値を１つインクリメントする（ステップＳ７１）。アドレス誤り判定部４２は、ｐの値をＫと比較し、ｐがＫよりも大きくなるまでステップＳ６３〜Ｓ７２を繰り返す。ｐの値がＫより大きくなるまで誤送信の恐れがあるメールアドレスの組み合わせが検出されなかった場合、アドレス誤り判定部４２は、誤送信ではないと判定して、処理を終了する（ステップＳ７３）。

〔送信メールの処理と通信装置から送信されたメールを用いた学習〕
次に、送信メールの処理について述べる。以下、送信確認部１５は、送信する電子メールが修正されているかを示す語句修正フラグを参照できるものとする。また、以下の説明では、語句修正フラグが１の場合に電子メールが修正されていることを示すものとし、送信メールの処理を開始するときに語句修正フラグは０に初期化されているものとする。

まず、新たに生成された送信メールが修正されずに送信される場合について説明する。本文誤り判定部４１とアドレス誤り判定部４２の判定結果は、送信確認部１５に出力される。送信確認部１５は、本文誤り判定部４１とアドレス誤り判定部４２の両方が誤送信ではないと判定すると、電子メール作成部１３に送信メールを送信部１２に出力することを要求する。このとき、送信確認部１５は、送信メールの識別子を電子メール作成部１３に通知する。電子メール作成部１３は、送信部１２に送信メールを出力し、電子メール作成部１３から送信部１２に出力されたメールは、宛先アドレスに向けて送信される。さらに、送信されたメールに基づいて、語句データベース２１や関連性データベース２３が更新される。データベースの更新については後述する。

一方、本文誤り判定部４１とアドレス誤り判定部４２のうちの１つ以上が誤送信と判定した場合、送信確認部１５は、誤送信と判定された送信メールとその送信メールを送信するかを確認する確認画面を、ディスプレイ等に表示する。図１６に、送信メールを送信するかを確認する確認画面の例を示す。ユーザは、表示された送信メールを確認して、メールに誤りが無いと判定すると、確認画面のメール送信ボタン７５を押し下す。メール送信ボタン７５が押し下された場合、送信確認部１５は、送信メールの識別子を電子メール作成部１３に通知する。電子メール作成部１３は、送信部１２に送信メールを出力し、メールの送信が行われる。また、後述するように、語句データベース２１や関連性データベース２３の更新も行われる。

表示されているメールに誤りがある場合、ユーザは、送信中止ボタン７６を押し下す。例えば、送信確認部１５は、本文誤り判定部４１が送信メールに誤りがあると判定している場合、語句修正フラグを１に設定する。さらに、送信確認部１５は、送信メールの識別子と共に送信の中止を電子メール作成部１３に通知する。電子メール作成部１３は、送信確認部１５から通知された識別子で識別される電子メールの修正画面をディスプレイに表示し、ユーザからの入力を待つ。ここで、修正画面で修正されるメールは、修正前のメールに付された識別子が付されるものとする。例えば、２０１００７０９１０３０の識別子のメールが修正された場合、修正後のメールの識別子も２０１００７０９１０３０が用いられる。

また、電子メール作成部１３は、通知された識別子を本文誤り判定部４１に通知する。本文誤り判定部４１は、通知された識別子に対応付けられている対象語句を修正前語句テーブルに記録する。図１７は修正前語句テーブルの例を示す図である。修正前語句テーブルには、対象語句に対応付けて、送信元アドレス、宛先アドレス、宛先アドレスの種類、対象語句が含まれているパラグラフの種類などが記録される。なお、この場合、語句データベース２１や関連性データベース２３は更新されない。ユーザによって修正が行われ、修正後のメールについて送信の指示が行われると、通信装置１０は、指示された送信メールについて、前述のとおりに誤送信かを判定する。

図１８は、ランク変更量テーブルの例を示す図である。ランク変更量テーブルは、語句データベース２１のランクの変更量を記録している。ランク変更量テーブルは、対象語句に対応付けられているアドレスの種類と、語句データベース更新部５１が語句データベース２１の更新に用いるランクの加算値を示している。ランクの加算値は、宛先アドレスの種類やメールが過去に修正されているかによって変動する。

図１８のＮｏ．１〜６は、誤送信であるかの判定が開始されてから修正が行われずに送信されたメールに含まれている対象語句に適用されるランクの加算値を示している。例えば、Ｎｏ．１は、対象語句に対応付けられた２つのアドレスが送信元アドレスとＴｏに指定された宛先アドレスの場合である。Ｎｏ．７〜２４は、誤送信であると判定された後で修正が行われ、修正後に送信されたメールに含まれている対象語句に適用されるランクの加算値を示している。Ｎｏ．７〜１２は、修正の前後で共通して用いられている対象語句のランクの加算値である。Ｎｏ．１３〜１８は、修正の前には用いられていなかったが修正後に用いられている対象語句のランクの加算値である。Ｎｏ．１９〜２４は、修正の前には用いられていたが修正後に用いられていない対象語句のランクの加算値である。

図１８に示すランクの加算値を用いて語句データベース２１が修正される場合、語句データベース更新部５１は、修正前の本文に誤って記載されていた対象語句のランクの加算値を、図１０（ａ）に示したような、受信メールによる学習の値よりも小さくする。例えば、語句データベース更新部５１は、誤って記載されていた対象語句についてのランクの加算値を負の値とすることができる。一方、修正により加えられた対象語句については、語句データベース更新部５１は、ランクの加算値を大きくする。以下、語句データベース更新部５１が用いるランクの加算値の選択方法と語句データベース２１の更新方法について述べる。

本文誤り判定部４１とアドレス誤り判定部４２の両方が誤送信ではないと判定すると、送信メールは修正されずに出力される。送信確認部１５は、送信する電子メールが修正されているかを示す語句修正フラグを確認する。送信確認部１５は、メールの送信を電子メール作成部１３に指示する際に、送信メールの識別子と送信メールの語句修正フラグの値を電子メール作成部１３に通知する。電子メール作成部１３は、送信メールを送信部１２に出力し、さらに、送信メールの識別子と語句修正フラグの値を本文誤り判定部４１に通知する。本文誤り判定部４１は、通知された識別子に対応付けられている対象語句と、語句修正フラグの値を、語句データベース更新部５１に出力する。

語句データベース更新部５１は、本文誤り判定部４１から入力されたデータを語句データベース２１に記録されているデータと比較する。対象語句、送信メールの識別子、パラグラフの種類、送信元アドレス、宛先アドレスの組み合わせが一致するデータが語句データベース２１に記録されている場合、語句データベース更新部５１は、語句データベース２１のランクの値を変更する。語句修正フラグの値が０の場合、語句データベース更新部５１は、アドレスの種類に合わせて図１８のＮｏ．１〜６から選択された値を、語句データベース２１のランクに加算する。なお、語句データベース２１に登録されていない対象語句は、語句データベース更新部５１により、新たに語句データベース２１に登録される。このときも図１８のＮｏ．１〜６に記録された加算値が用いられる。

一方、ユーザによって修正が行われ、修正後のメールに誤りがないと判定されると、語句修正フラグは１に設定されている。この場合、語句データベース更新部５１は、送信メールに含まれている対象語句と、修正前語句テーブルに含まれている語句を比較する。対象語句が送信メールと修正前語句テーブルの両方に含まれている場合、語句データベース更新部５１は、図１８のＮｏ．７〜１２に指定されたランクを用いて語句データベース２１を更新する。送信メールに含まれていて修正前語句テーブルに含まれていない対象語句について、語句データベース更新部５１は、図１８のＮｏ．１３〜１８に指定されたランクを用いて語句データベース２１を更新する。また、送信メールに含まれておらず、修正前語句テーブルに含まれている対象語句について、語句データベース更新部５１は、図１８のＮｏ．１９〜２４に指定されたランクを用いて語句データベース２１を更新することにより、ランクの値を小さくする。なお、この場合も、送信されたメールに含まれている対象語句のうちで、語句データベース２１に登録されていない対象語句は、語句データベース更新部５１により、新たに語句データベース２１に登録される。

このように、誤っているメールに記載されているが修正後の送信メールに記載されていない修正語句は、そのメールの送信元アドレスと宛先アドレスの間での通信に用いられる可能性を表すランクの値が小さく変更される。一方、修正後の送信メールに含まれる対象語句は、そのメールの送信元アドレスと宛先アドレスの間での通信に用いられる可能性を表すランクの値が大きく変更される。

図１９は、関連性データベースの更新に際して行われる動作の例を説明するフローチャートである。図１９を参照しながら、誤送信ではないと判定されたメール、もしくは、ユーザから送信が指示された送信メールに含まれているアドレスに基づいて、関連性データベース２３が更新されるときの関連性データベース更新部５３の動作について説明する。

メールが送信されると、関連性データベース更新部５３は、アドレス誤り判定部４２から送信されたメールの送信元アドレスと宛先アドレス、および、各宛先アドレスの種類と、アドレスの総数Ｋを取得する（ステップＳ８１、Ｓ８２）。ここで、ステップＳ８２において、関連性データベース更新部５３は、アドレス誤り判定部４２から、送信元アドレス、Ｔｏに指定された宛先アドレス、ＣＣに指定された宛先アドレス、ＢＣＣに指定された宛先アドレスを通知される。また、定数Ｋは、送信元アドレス、Ｔｏに指定された宛先アドレス、ＣＣに指定された宛先アドレス、ＢＣＣに指定された宛先アドレスの総数であるとする。ステップＳ８３〜Ｓ８７の処理は、図１２を参照しながら説明したステップＳ２３〜Ｓ２７と同様である。ただし、ステップＳ８５においてアドレスの関連性（Ｒ_ｉｊ）の算出に用いられる区分係数は、以下に示すように、ＢＣＣの宛先には、ＣＣに指定された宛先より小さい値が割り当てられるものとする。
送信元アドレス（Ｆｒｏｍ）の区分係数：１
宛先アドレス（Ｔｏ）の区分係数：１
宛先アドレス（ＣＣ）の区分係数：０．５
宛先アドレス（ＢＣＣ）の区分係数：０．２５
また、ステップＳ８８とＳ９０では、変数ｉ、ｊは、定数Ｋと比較されるものとする。

なお、共通語句データベース更新部５２の動作は、受信メールについての学習と同様に行われる。共通語句データベース更新部５２により、共通語句データベース２２は、適宜、更新される。

図２０Ａ〜図２０Ｄは、送信メールに基づくデータベースの更新方法の例を説明するフローチャートである。以下の例では、語句修正フラグ、本文誤りフラグ、アドレス誤りフラグの３種類のフラグが用いられる。本文誤りフラグは、本文誤り判定部４１が、送信メールに含まれているパラグラフのいずれかに誤りがある可能性があると判定したことを示す。アドレス誤りフラグは、アドレス誤り判定部４２が、宛先アドレスのいずれかが誤っている可能性があると判定したことを示す。なお、図２０Ａ〜図２０Ｄは、通信装置１０の動作の一例であり、例えば、通信装置１０は、本文の誤りをチェックする前にアドレスの関連性による誤送信の検出を行うこともできる。すなわち、ステップＳ１０３〜Ｓ１０５の処理は、ステップＳ１０６の判定の後に行われる場合がある。また、前述のように、ステップＳ１２８とＳ１２９の順序を変更することもできる。さらに、以下の例では、送信確認部１５は、確認画面を介して入力された情報を、本文誤り判定部４１、アドレス誤り判定部４２、電子メール作成部１３に通知するものとする。

送信メールが電子メール作成部１３から電子メール分割部１４に出力されると、送信確認部１５は、語句修正フラグを０に設定する（ステップＳ１０１）。また、本文誤り判定部４１は本文誤りフラグを０に設定し、アドレス誤り判定部４２はアドレス誤りフラグを０に設定する（ステップＳ１０２）。本文誤り判定部４１は、パラグラフごとに対象語句を抽出し、語句データベース２１に記録されているランクに基づいて、送信メールの本文に誤りがあるかを判定する（ステップＳ１０３、Ｓ１０４）。本文誤り判定部４１は、送信メールの本文に誤りがあると判定すると、本文誤りフラグを１に設定する（ステップＳ１０４、Ｓ１０５）。一方、本文誤り判定部４１が本文に誤りがないと判定した場合、本文誤りフラグは０に設定されたままになる。

次に、アドレス誤り判定部４２は、送信メールに含まれている宛先アドレスと送信元アドレスの関連係数を関連閾値と比較する。関連係数が関連閾値よりも低い場合、アドレス誤り判定部４２は、語句データベース２１を参照する。アドレス誤り判定部４２は、関連閾値が低い２つのメールアドレスに対応付けて署名の欄に記録されている対象語句を取得する。両者に共通する語句の数が類似閾値以上であれば、署名の類似性が高いと判定する。署名の類似性が高い場合、アドレス誤り判定部４２は、誤送信と判定しない（ステップＳ１０６でＮｏ）。送信確認部１５は、アドレス誤り判定部４２で誤りと判定されない場合、本文誤りフラグを確認することにより、本文誤り判定部４１の判定結果を確認する（ステップＳ１０７)。本文誤りフラグが０であれば、本文とアドレスのいずれにも誤りが無いため、通信装置１０は、送信メールを宛先アドレスに向けて送信する（ステップＳ１０８）。

送信確認部１５は、メールを送信する旨を電子メール作成部１３に通知した後、語句修正フラグが１になっているかを確認する（ステップＳ１０９)。語句修正フラグが０である場合、送信されたメールは本文の語句が修正されていないことを示す。そこで、語句データベース更新部５１は、本文誤り判定部４１から通知された対象語句の情報に基づいて、語句データベース２１を更新する（ステップＳ１１０）。また、関連性データベース更新部５３は、関連性データベース２３を更新する（ステップＳ１１１）。

一方、語句修正フラグが１の場合、送信メールの識別子に対応付けられた修正前語句テーブルが生成されている。そこで、語句データベース更新部５１は、修正前語句テーブルと本文誤り判定部４１から通知された対象語句を比較する（ステップＳ１１２）。語句データベース更新部５１は、送信メールに含まれている対象語句のランクに正の値を加える。一方、送信メールに含まれずに修正前語句テーブルに含まれている対象語句については、対象語句のランクの値を小さくする（ステップＳ１１３）。

ステップＳ１０７において、本文誤りフラグが１であると判定された場合、図２０Ｂに示す処理が行われる。送信確認部１５は、図１６に示すような確認画面を生成し、ユーザからの入力を待つ（ステップＳ１２１）。ユーザが確認画面において送信を指示すると、送信確認部１５はメールの送信を電子メール作成部１３に通知する。電子メール作成部１３は、送信部１２を介して送信メールを送信する（ステップＳ１２２）。その後、ステップＳ１２３〜Ｓ１２７の処理により、語句データベース２１、関連性データベース２３が更新される。ステップＳ１２３〜Ｓ１２７は、ステップＳ１０９〜Ｓ１１３と同様である。

一方、ユーザから送信の中止が指示されると、送信確認部１５は、その旨を電子メール作成部１３と本文誤り判定部４１に通知する。本文誤り判定部４１は、対象語句を修正前語句テーブルに格納する（ステップＳ１２１でＮｏ、ステップＳ１２８）。次に、送信確認部１５は、語句修正フラグを１に設定する（ステップＳ１２９）。電子メール作成部１３は、送信メールの修正画面を表示する（ステップＳ１３０）。修正画面でメールが修正され、ユーザから再度、送信が指示されると、図２０Ａに示すステップＳ１０２以降の処理が行われる（ステップＳ１３１）。

ステップＳ１０６において、関連性が関連閾値未満で、さらに、署名の類似性が低いアドレスの組み合わせがある場合、アドレス誤り判定部４２は、アドレスに誤りがある可能性があると判定する。そこで、アドレス誤り判定部４２は、アドレス誤りフラグを１に設定する（ステップＳ１１４）。次に、送信確認部１５は、本文誤りフラグの値を確認する（ステップＳ１１５）。本文誤りフラグが０の場合の処理を図２０Ｃに示す。送信確認部１５は、確認画面を出力して、ユーザからの入力を待つ。ユーザからメールの送信が指示されると、送信確認部１５は、メールの送信が指示されたことと送信が指示されたメールを識別する識別子を、電子メール作成部１３、本文誤り判定部４１、アドレス誤り判定部４２に通知する（ステップＳ１４１でＹｅｓ）。電子メール作成部１３がメールを送信部１２に出力することにより、送信メールが宛先アドレスに向けて送信される（ステップＳ１４２）。関連性データベース更新部５３は、アドレス誤り判定部４２から取得した送信元メールアドレス、宛先メールアドレス、宛先メールアドレスの種類に応じて、関連性データベース２３を更新する（ステップＳ１４３）。ステップＳ１４４〜Ｓ１４６の処理は、ステップＳ１２３〜Ｓ１２６の処理と同様である。

一方、ユーザからメールを送信しないことを通知されると、送信確認部１５は、メールの識別子とメールを送信しないことを電子メール作成部１３に通知する（ステップＳ１４１でＮｏ）。電子メール作成部１３は、メールの修正画面を表示する（ステップＳ１４８）。修正画面でメールが修正され、ユーザから再度、送信が指示されると、図２０Ａに示すステップＳ１０２以降の処理が行われる（ステップＳ１４９）。

ステップＳ１１５で本文誤りフラグが１である場合の処理を図２０Ｄに示す。ステップＳ１５１〜Ｓ１５７の処理は、図２０Ｃを参照しながら説明したステップＳ１４１〜Ｓ１４７の処理と同様である。また、ステップＳ１５８〜Ｓ１６１の処理は、図２０Ｂを参照しながら説明したステップＳ１２８〜Ｓ１３１の処理と同様である。

このように、本実施形態では、共通語句データベース２２に記録されている語句を除いた対象語句の出現頻度を用いて誤送信であるかを判定する。従って、通信装置１０は、同業者に良く用いられる語句や挨拶文などを判定対象とした影響によって判定結果が正常値に偏りがちになることを防ぎ、誤送信の検出精度を向上することができる。

さらに、本実施形態では、メールの修正により加えられた対象語句のランクの加算値は、修正前のメールと修正後のメールの両方に含まれている対象語句のランクの加算値よりも大きい。このため、語句データベース更新部５１は、ユーザの修正内容に合わせて語句データベース２１を更新することができる。さらに、本実施形態では、メールの修正により修正後のメールから削除された対象語句は、そのメールに記載することが望ましくない対象語句である可能性が高いため、対応するランクの値が小さく変更される。すなわち、誤送信の判断基準となる語句データベース２１がユーザの修正結果に基づいて変更されるので、ユーザの使用回数が増加するほど、通信装置１０の誤送信判定の結果は、ユーザの判定に近づく可能性が高い。

また、通信装置１０は、送信メールの誤送信の判定を行う際に、本文や引用文など、宛先に応じて内容が変動する可能性が大きなパラグラフに記載されている内容について判定を行う。このため、挨拶文など宛先が変化しても同じ語句が使われる可能性が高いパラグラフの判定結果によって誤送信の検出に失敗する可能性が低くなる。

＜第２の実施形態＞
第２の実施形態に係る通信装置１０は、通信装置１０が本文に誤りがあると判定しても、ユーザが誤送信ではないと判定した場合と、通信装置１０とユーザの判定が一致した場合で、語句データベース更新部５１の処理が異なる。第２の実施形態にかかる通信装置１０は、２種類のランク変更量テーブルを備える。一方のランク変更量テーブルは、他方に比べて、送信されたメールに含まれている対象語句のランクの加算値が大きい。

例えば、通信装置１０は、図１８に示すランク変更量テーブルと図２１に示すランク変更量テーブルを備えることができる。図２１のランク変更量テーブルでは、図１８のランク変更量テーブルと比べて、送信されたメールに含まれている対象語句のランクの加算値（Ｎｏ．１〜１８）が大きくなっている。語句データベース更新部５１は、図１８に示すランク変更量テーブルと図２１に示すランク変更量テーブルを併用する。本文誤り判定部４１で本文に誤りがあると判定されていないメールが送信される場合、語句データベース更新部５１は、図１８に示すランク変更量テーブルを用いて語句データベース２１を更新する。すなわち、ステップＳ１１０、Ｓ１１３、Ｓ１４６、Ｓ１４７の場合、語句データベース更新部５１は、図１８に示すランク変更量テーブルを用いて語句データベース２１を更新する。

一方、本文誤り判定部４１で本文に誤りがあると判定されたメールが、ユーザが確認画面を確認して誤送信ではないと判定し、送信を指示した場合、語句データベース更新部５１は、図２１に示すランク変更量テーブルを用いて語句データベース２１を更新する。すなわち、ステップＳ１２５、Ｓ１２６、Ｓ１５６、Ｓ１５７の場合、語句データベース更新部５１は、図２１に示すランク変更量テーブルを用いて語句データベース２１を更新する。

通信装置１０は、本文誤り判定部４１が本文に誤りがあると判定したメールについて、ユーザにより誤送信ではないと判定されたとき、送信されたメールに含まれている対象語句のランクの加算値が大きいランク変更量テーブルを用いる。その結果、通信装置１０により本文に誤りがあると判定されてもユーザにより誤りが無いと判定された場合、送信メールに含まれている対象語句についての加算値は、通信装置１０とユーザの判断が一致した場合に比べて大きな値となる。従って、第２の実施形態によると、ユーザの判断と通信装置１０の判断のずれを小さくすることができる。

＜第３の実施形態＞
第３の実施形態に係る通信装置１０は、宛先アドレスの修正が行われた場合、関連性データベース更新部５３は、修正の内容を反映するように関連性データベース２３を更新する。修正によって追加されたアドレスは、ユーザによって宛先アドレスとすることが明示的に示されたアドレスである。すなわち、修正によって追加されたアドレスは、他の宛先アドレスや送信元アドレスとの関連性が高いことがユーザから明示的に示されたアドレスである。従って、関連性データベース更新部５３は、修正によって追加されたアドレスについて、関連性の値を１に近づける。例えば、関連性データベース更新部５３は、追加されたアドレスについての関連性を、関連性データベース２３に記録されている関連性の値と１との平均値に変更する。一方、修正によって削除されたアドレスは、ユーザによって宛先アドレスとすることが明示的に否定されたアドレスである。そこで、関連性データベース更新部５３は、修正によって削除されたアドレスについて、他の宛先アドレスとの関連性の値を０に近づける。第３の実施形態では、データ３２には、修正前アドレステーブル（図２２）も含まれる。

関連性データベース更新部５３は、宛先アドレスが修正されているかを、アドレス修正フラグを確認することにより特定する。アドレス修正フラグが１に設定されている場合、誤送信の判定が開始された後に送信メールの宛先アドレスが修正されていることを示す。一方、アドレス修正フラグが０の場合、送信メールについて誤送信の判定が開始されてから宛先アドレスが修正されていないことを示す。送信確認部１５は、アドレスに誤りがあると判定され、ユーザから送信を中止する旨の指示を受け取ったメールについて、そのメールの識別子に対応付けられたアドレス修正フラグの値を１に設定する。さらに、送信確認部１５は、アドレス誤り判定部４２に、送信を中止したメールの識別子を通知し、その識別子に対応付けられている宛先アドレスを修正前アドレステーブルに格納するように要求する。修正前アドレステーブルの例を図２２に示す。修正前アドレステーブルには、送信の中止が指示された送信メールの識別子と宛先アドレスが対応付けて記録される。

図２３は、第３の実施形態に係る関連性データベース更新部５３の処理の例を説明する図である。例えば、修正前のメールの宛先アドレスはｘ１、ｘ２、ｘ３であるとする。一方、修正後の宛先アドレスは、ｘ１、ｘ３、ｘ４であるとする。また、関連性データベース２３に記録されているｘ１〜ｘ４の関連性は、次のとおりであるものとする。
ｘ１とｘ２の関連性：０．５８
ｘ１とｘ３の関連性：０．７５
ｘ１とｘ４の関連性：０．６０
ｘ２とｘ３の関連性：０．２２
ｘ２とｘ４の関連性：０．０３
ｘ３とｘ４の関連性：０．８４

ここで、修正によって追加された宛先アドレスは、ｘ４である。従って、ｘ４は、ｘ１やｘ３と同じメールを受信する可能性は高い。そこで、関連性データベース更新部５３は、図２３のＮｏ．３とＮｏ．６に示すように、ｘ４とｘ１の関連性およびｘ４とｘ３の関連性を１に近づける。このとき、関連性データベース更新部５３は、関連性データベース２３に記録されている関連性と１の平均値を更新後の関連性の値とする。ｘ１とｘ４の関連性は０．６０であることが関連性データベース２３に記録されている。そこで、関連性データベース更新部５３は、（０．６０＋１）／２＝０．８０より、ｘ１とｘ４の関連性を０．８０に変更する。同様に、関連性データベース更新部５３は、ｘ３とｘ４の関連性や、ｘ４と送信元アドレスの間の関連性も更新する。

一方、修正により削除された宛先アドレスはｘ２である。従って、ｘ２は、ｘ１やｘ３と同じメールを受信する可能性は低い。そこで、関連性データベース更新部５３は、図２３のＮｏ．１とＮｏ．４に示すように、関連性を０に近づける。このとき、関連性データベース更新部５３は、関連性データベース２３に記録されている関連性と０の平均値を更新後の関連性の値とする。ｘ１とｘ２の関連性は０．５８であることが関連性データベース２３に記録されている。そこで、関連性データベース更新部５３は、（０．５８＋０）／２＝０．２９より、ｘ１とｘ２の関連性を０．２９に変更する。同様に、関連性データベース更新部５３は、ｘ２とｘ３の関連性や、ｘ２と送信元アドレスの間の関連性も更新する。なお、図２３を参照しながら述べた計算は、関連性データベース更新部５３の動作の例であり、関連性データベース更新部５３の行う計算は、実装に応じて変更されることがある。

図２４は、第３の実施形態に係る関連性データベース更新部５３の動作の例を説明する図である。なお、図２４は動作の例を表しており、関連性データベース更新部５３の動作は、実装に応じて変更されることがある。例えば、ステップＳ１７３、Ｓ１７４の処理をステップＳ１７６の後で行われる場合もある。

メールが送信されたことが通知されると、関連性データベース更新部５３は、送信されたメールの識別子に対応付けられたアドレス修正フラグの値を確認する（ステップＳ１７１、Ｓ１７２）。アドレス修正フラグが１である場合、関連性データベース更新部５３は修正によって加えられた宛先アドレスを取得する（ステップＳ１７２でＹｅｓ、ステップＳ１７３）。次に、関連性データベース更新部５３は、修正により追加された宛先アドレスと、送信メールの他の宛先アドレスや送信元アドレスとの間の関連性の値を１に近づける（ステップＳ１７４）。さらに、関連性データベース更新部５３は、修正により削除された宛先アドレスを取得する（ステップＳ１７５）。関連性データベース更新部５３は、削除された宛先アドレスについて、送信メールの他の宛先アドレスや送信元アドレスとの間の関連性の値を０に近づける（ステップＳ１７６）。

一方、アドレス修正フラグが０である場合、関連性データベース更新部５３は、送信メールの宛先アドレスと送信元アドレスを取得する（ステップＳ１７２でＮｏ、ステップＳ１７７）。さらに、関連性データベース更新部５３は、取得したアドレスについて、図１９を参照しながら説明したように、区分係数を用いて計算した関連性と関連性データベース２３に記録されている値に基づいて、関連性データベース２３を更新する（ステップＳ１７８）。

図２５Ａ〜Ｄは、第３の実施形態で行われるデータベースの更新方法の例を説明するフローチャートである。送信メールが電子メール作成部１３から電子メール分割部１４に出力されると、送信確認部１５は、語句修正フラグとアドレス修正フラグを０に設定する（ステップＳ２０１）。ステップＳ２０２〜Ｓ２１５は、図２０Ａを参照しながら説明したステップＳ１０２〜Ｓ１１５と同様である。

ステップＳ２１５で本文誤りフラグが０である場合の動作を図２５Ｂに示す。図２５Ｂは、メールの本文からは誤送信と判定されず、アドレスの関連性から誤送信の可能性があると判定された場合の動作を表している。ユーザが誤送信であると判断すると、送信確認部１５は、メールの送信先アドレスを、メールの識別子と関連付けて修正前アドレステーブルに格納し、アドレス修正フラグを１に設定する（ステップＳ２２１でＮｏ、ステップＳ２２８、Ｓ２２９）。さらに、送信確認部１５は、メールの修正画面を表示する（ステップＳ２３０）。メールの修正が行われユーザからの送信指示があると、ステップＳ２０２以降の処理が行われる（ステップＳ２３１)。ユーザが誤送信ではないと判断した場合のステップＳ２２２〜Ｓ２２７の動作は、図２０Ｃを参照しながら説明したステップＳ１４２〜Ｓ１４７の動作と同様である。

図２５ＡのステップＳ２１５で本文誤りフラグが１である場合の動作を図２５Ｃに示す。図２５Ｃは、メールの本文から誤送信と判定され、アドレスの関連性からも誤送信の可能性があると判定された場合の動作を表している。ユーザが誤送信であると判断すると、送信確認部１５は、メールの送信先アドレスを、メールの識別子と関連付けて修正前アドレステーブルに格納し、アドレス修正フラグを１に設定する（ステップＳ２４１でＮｏ、ステップＳ２４８、Ｓ２４９）。ステップＳ２５０〜Ｓ２５３の動作は、図２０Ｄを参照しながら説明したステップＳ１５８〜Ｓ１６１と同様である。なお、メールの修正が行われた後でユーザからの送信指示があると、ステップＳ２０２以降の処理が行われる（ステップＳ２５３)。ユーザが誤送信ではないと判断した場合のステップＳ２４２〜Ｓ２４７の動作は、図２０Ｄを参照しながら説明したステップＳ１５２〜Ｓ１５７の動作と同様である。

図２５ＡのステップＳ２０７で本文誤りフラグが１である場合の処理を図２５Ｄに示す。ステップＳ２６１〜Ｓ２７１の動作は、図２０Ｂを参照しながら説明したステップＳ１２１〜１３１と同様である。ただし、ステップＳ２７１でユーザからの送信指示があると、ステップＳ２０２以降の処理が行われる。

このように、第３の実施形態に係る通信装置１０は、宛先アドレスの修正が行われた場合、関連性データベース更新部５３は、修正の内容を反映してデータベースを修正する。したがって、本実施形態によると、宛先アドレスの判断について、通信装置１０の判断結果とユーザとの判断結果のずれを小さくすることができる。

＜第４の実施形態＞
メールサーバ、ゲートウェイ装置などが、送信メールについての誤送信の判定や語句データベース２１などの更新を実施することもできる。第４の実施形態の場合は、誤送信判定装置９０を備える装置は、メールの送信元の通信装置とメールの受信先の通信装置の間で送受信されるメールを中継する。誤送信判定装置９０を備える装置は、メールを中継する際に、メールの送信元アドレスと宛先アドレスの関係やメールに含まれている対象語句に基づいて、メールが誤送信である可能性があるかを判定する。

誤送信判定装置９０は、メールサーバ、ゲートウェイ装置などに搭載され、誤送信判定装置９０は、第１〜第３の実施形態で説明した誤送信防止方法を実施する。図２６は、第４の実施形態に係るネットワークの例を示す。図２６（ａ）に示すネットワーク７０は、ユーザ端末９１（９１ａ〜９１ｃ）、Message Transfer Agent（ＭＴＡ）９２、ゲートウェイ９３を備える。図２６（ａ）の例では、ＭＴＡ９２が、誤送信判定装置９０を含んでいる。また、図２６（ｂ）に示すように、ゲートウェイ９３が誤送信判定装置９０を含むこともできる。図２６（ｃ）には、誤送信判定装置９０がインターネット９４の誤送信防止サービスサーバ９５に搭載されている場合の例を示す。ユーザ端末９１（９１ｄ〜９１ｆ）から送られた送信メールは、誤送信防止サービスサーバ９５で処理されることにより、誤送信であるかの判定が行われる。

図２７は、第４の実施形態に係る誤送信判定装置９０の例を示す図である。送信判定装置９０は、受信部１７、送信部１２、電子メール分割部１４、送信確認部１８、タイマ１６、記憶部２０、判定部４０、データベース更新部５０を備える。判定部４０は、本文誤り判定部４１とアドレス誤り判定部４２を備える。記憶部２０は、語句データベース２１、共通語句データベース２２、関連性データベース２３、辞書データ３１、データ３４、プログラム３３を備える。データベース更新部５０は、語句データベース更新部５１、共通語句データベース更新部５２、および、関連性データベース更新部５３を備える。電子メール分割部１４、タイマ１６、判定部４０、データベース更新部５０の動作は、第１〜第３の実施形態のいずれかと同様である。また、語句データベース２１、共通語句データベース２２、関連性データベース２３、辞書データ３１、プログラム３３も第１〜第３の実施形態のいずれかと同様である。

誤送信判定装置９０では送信メールが作成されないので、誤送信判定装置９０は、受信部１７を介して受信した電子メールに基づいて、誤送信の判定やデータベースの更新を行う。誤送信判定装置９０は、データ３４にアドレス情報を記憶している。アドレス情報は、誤送信判定装置９０が誤送信の判定を行う対象となる送信元メールアドレスである。受信部１７は、データ３４を参照して、誤送信判定装置９０が搭載されているメールサーバ等で受信されたメールのうち、アドレス情報に記録されているアドレスが送信元アドレスか宛先アドレスであるメールを取得する。アドレス情報に記録されているアドレスが送信元アドレスであるメールは、第１〜第３の実施形態での送信メールと同様に用いられる。すなわち、誤送信判定装置９０は、アドレス情報に記録されているアドレスが送信元アドレスであるメールについて誤送信の判定を行い、判定結果に基づいてメールの送信後のデータベースの更新を行う。一方、宛先アドレスにアドレス情報に記録されているアドレスが含まれているメールについて、誤送信判定装置９０は、第１〜第３の実施形態での受信メールと同様の処理を行う。すなわち、宛先アドレスにアドレス情報に記録されているアドレスが含まれているメールについては誤送信の判定を行わずに、データベースの更新に使用する。

送信確認部１８は、送信メールが誤送信であるかを本文誤り判定部４１とアドレス誤り判定部４２の判定結果に基づいて判定し、得られた結果を送信者に通知する。図２８は、送信メールが誤送信であると判定された場合のユーザへの通知方法の例を説明するフローチャートである。送信確認部１８は、誤送信と判定されたメールについて、誤送信の可能性があることと、誤送信と判定した理由を記述した通知メールを作成し、送信部１２を介して、判定対象となったメールの送信元アドレスに送信する（ステップＳ２８１）。なお、ここで、送信確認部１８は、誤送信と判定した電子メールを識別する識別子を付し、その識別子を、通知メールに含めるものとする。送信確認部１８は、通知メールを送信してからタイマ１６がタイムアップするまで待機する。ユーザ端末９１に通知メールが届くと、ユーザにより誤送信かの判断が行われる。その後、ユーザの判断に基づいてユーザ端末９１から、メールの送信を指示するメッセージか、送信を中止する旨を通知するメッセージが誤送信判定装置９０を含む装置に送信される。ここで、これらのメッセージには、誤送信と判定されたメールを特定するための識別子が含まれているものとする。

送信確認部１８は、識別子を用いて、ユーザ端末９１から通知メールに対する返信のメッセージを受信したかを確認する（ステップＳ２８２）。送信確認部１８は、返信のメッセージを受信すると、ユーザの判断を確認する（ステップＳ２８５）。ユーザからのメッセージが送信を中止することを通知している場合、送信確認部１８は、本文誤り判定部４１とアドレス誤り判定部４２に送信の中止を通知する。本文誤り判定部４１は、判定対象のメールに含まれていた対象語句、宛先アドレス、送信元アドレス等を修正前語句テーブルに記録する。同様に、アドレス誤り判定部４２は、判定対象のメールに含まれていた宛先アドレス、宛先アドレスの種類、送信元アドレス等を修正前アドレステーブルに記録する。また、送信確認部１８は、本文誤り判定部４１が誤送信の可能性があると判定している場合は、語句修正フラグを１に設定する。また、アドレス誤り判定部４２が誤送信の可能性があると判定している場合は、アドレス修正フラグを１に設定する。（ステップＳ２８６）。ユーザは、送信が中止されたメールの識別子に対応づけて、修正後のメールを、誤送信判定装置９０を含む装置に送信する。修正後のメールが誤送信と判定されない場合や、ユーザからの送信指示に基づいて送信される場合、メールの送信後に行われるデータベースの更新では、修正前語句テーブルや修正前アドレステーブルが用いられる。データベースの更新方法は、第１〜第３の実施形態で説明した方法と同様である。

一方、ユーザからメールを送信する旨のメッセージを受信した場合、誤送信判定装置９０は、判定対象のメールを宛先アドレスに向けて送信する（ステップＳ２８７）。また、第１〜第３の実施形態で説明したように、データベースの更新が行われる。

タイマ１６がタイムアウトする前に誤送信判定装置９０がユーザからの指示を含むメッセージを受信しない場合、送信確認部１８は、ユーザが電子メールの送信を中止したとみなす。そこで、送信確認部１８は、送信部１２を介して、対象電子メールの送信を中止したことを通知するメールを、送信元アドレスに向けて送信する（ステップＳ２８３）。また、このとき、判定対象となった送信メールを送信元アドレスに送信する。その後、送信確認部１８は、本文誤り判定部４１とアドレス誤り判定部４２に、判定対象の電子メールについて記憶している対象語句、宛先アドレス、宛先アドレスの種類、送信元アドレスなどのデータと、判定結果を破棄するように要求する（ステップＳ２８４）。その結果、誤送信判定装置９０は、対象の電子メールの送信や対象電子メールに基づくデータベースの更新を行わない。

このように、本実施形態によると、メールサーバなどが、送信メールについての誤送信の判定などを実施することもできるため、メールサーバなどに誤送信判定装置９０を搭載することにより、誤送信の判定を行うことができる。従って、ユーザ端末９１に改変を加えることなく、電子メールの誤送信判定を行うことができ、第１〜第３の実施形態に比べて、システムの導入が容易である。

＜その他＞
なお、実施形態は上記に限られるものではなく、様々に変形可能である。以下にその例をいくつか述べる。

例えば、語句データベース更新部５１は、一定期間以上使われていない対象語句のランクを０に近づけるように変形される場合がある。例えば、語句データベース更新部５１は、語句データベース２１に含まれている語句とアドレスアドレスの組合せの各々について、最終更新日を確認する。語句データベース更新部５１は、最終更新日から一定の期間以上、登録されたアドレスの間で対応付けられた語句が使用されていない場合、その語句について、語句データベース２１に記録されたランクを１ずつ０に近づくように修正する。すなわち、語句データベース更新部５１は、ランクの値が正の値であれば、ランクの値を１つ小さくし、ランクの値が負であれば、ランクの値を１だけ大きくする。

ここで、一定の期間を語句ごとに決定することもできる。例えば、語句データベース更新部５１は、ユーザＡとユーザＢのメールアドレスに対応付けて記憶されている対象語句ａについて、ランクの値が更新された履歴を参照して、ランクの値の更新が行われる周期（更新周期）を求めることができる。語句データベース更新部５１は、求めた更新周期よりも長い時間にわたってランクが更新されていない場合、語句データベース更新部５１は、対象語句ａのランクの値を１だけ０に近づくように変更する。その後、語句データベース更新部５１は、更新周期ごとに対象語句ａのランクが更新されているかを確認し、対象語句ａのランクが更新されていない期間が更新周期よりも長くなると、対象語句ａのランクを１だけ０に近づける。

このように変形することにより、過去に頻繁に使用された語句が使用されなくなった場合に、語句データベース更新部５１は、使用される語句の変遷を反映して語句データベース２１を更新することができる。

また、共通語句データベース２２をオペレータなどが予め決定しておいて、記憶部２０に読み込むことができる。この場合は、共通語句データベース２２は固定されているので、通信装置１０もしくは誤送信判定装置９０は、共通語句データベース更新部５２を備えない。

アドレス誤り判定部４２は、署名が類似しているかを判定する際に、２つのアドレスに共通している語句の数が２つのアドレスに関連付けて登録されている対象語句の総数に占める割合を用いることもできる。例えば、２つのアドレスに共通する語句の数をＸｃｏｍとする。また、一方のアドレスに関連付けて登録されている対象語句の数をＸ１、他方のアドレスに関連付けて登録されている対象語句の数をＸ２とする。アドレス誤り判定部４２は、次式から類似度Ｓを算出する。
Ｓ＝２×Ｘｃｏｍ／（Ｘ１＋Ｘ２）
アドレス誤り判定部４２は、類似度Ｓの値を類似閾値と比較する。類似度Ｓが類似閾値以上の場合、署名が類似していると判定する。一方、類似度Ｓが類似閾値未満の場合、署名が類似していないと判定する。判定後のアドレス誤り判定部４２の動作は、第１〜第４の実施形態と同様である。

上述の第１〜第４実施形態を含む各実施形態に対し、さらに以下の付記を開示する。
（付記１）
送信もしくは受信された電子メールに含まれている語句の出現頻度を、前記電子メールの宛先アドレスおよび送信元アドレスと対応付けて、語句データベースに記憶し、
送信される対象電子メールに含まれている語句のうちで、複数の電子メールに共通して用いられる語句を記録する共通語句データベースに含まれていない語句である対象語句を抽出すると共に、前記対象語句の総数を取得し、
前記対象語句の各々について、前記対象電子メールの宛先アドレスと対応付けて前記語句データベースに記憶されている前記出現頻度を第１の閾値と比較し、前記出現頻度が前記第１の閾値よりも大きい対象語句の数を取得し、
前記出現頻度が前記第１の閾値よりも大きい対象語句の数の前記総数に対する割合が第２の閾値未満の場合に、前記対象電子メールの送信は誤送信と判定する
処理をコンピュータに実行させることを特徴とする判定プログラム。
（付記２）
誤送信の可能性があると判定された第１の対象電子メールから抽出された対象語句を、前記第１の対象電子メールの宛先アドレスである第１のアドレスと、前記第１の対象電子メールの送信元アドレスである第２のアドレスとに対応付けて、修正前語句テーブルに記憶し、
前記第１の対象電子メールを修正して作成された第２の対象電子メールの送信が誤送信と判定されていない場合、
前記第２の対象電子メールから抽出された対象語句のうちで、前記修正前語句テーブルに記憶されている対象語句の出現頻度を大きくし、
前記第２の対象電子メールから抽出された対象語句ではなく、前記修正前語句テーブルに記憶されている対象語句の出現頻度を小さくする
処理を前記コンピュータにさらに実行させることを特徴とする付記１に記載の判定プログラム。
（付記３）
第１の対象語句を含むメールが前記第１のアドレスで送信もしくは受信された時刻の履歴から、前記第１の対象語句の前記第１のアドレスに対応付けられた出現頻度が更新された後で、再度前記第１の対象語句の前記第１のアドレスに対応付けられた出現頻度が更新されるまでにかかる時間を表す更新周期を算出し、
前記第１の対象語句の出現頻度が最後に更新された時刻から前記更新周期が経過しても、前記第１の対象語句が含まれているメールが前記第１のアドレスで送信もしくは受信されていない場合、前記第１の対象語句の前記第１のアドレスに対応付けられた出現頻度を小さくする
処理を前記コンピュータにさらに実行させことを特徴とする付記２に記載の判定プログラム。
（付記４）
第１の宛先と第２の宛先とに同一の電子メールが送信される可能性を表す関連係数を、関連データベースに記憶し、
前記第１の宛先に送信される対象電子メールが前記第２の宛先にも送信される場合、前記関連係数が関連閾値以上であるかを確認し、
前記関連係数が前記関連閾値未満の場合、前記対象電子メールの送信は誤送信であると判定する
処理を前記コンピュータにさらに実行させることを特徴とする付記１〜３のいずれかに記載の判定プログラム。
（付記５）
前記第１および第２の宛先を含む第１の対象電子メールの送信が誤送信と判定されると、前記第１の対象電子メールの宛先を修正前アドレステーブルに記憶し、
前記第１の対象電子メールを修正して作成された第２の対象電子メールの送信が誤送信と判定されていない場合、前記修正前アドレステーブルに記録されている前記第１の対象電子メールの宛先と、第２の対象電子メールの宛先を比較し、
前記修正前アドレステーブルに記録され、かつ、前記第２の対象電子メールの宛先に含まれていない宛先と、前記修正前アドレステーブルと前記第２の対象電子メールに共通する宛先との間の関連係数を小さくする
処理を前記コンピュータにさらに実行させることを特徴とする付記４に記載の判定プログラム。
（付記６）
前記第２の対象電子メールの宛先に含まれ、かつ、前記修正前アドレステーブルに記録されていない宛先と、前記修正前アドレステーブルと前記第２の対象電子メールに共通する宛先との間の関連係数を大きくする
処理を前記コンピュータにさらに実行させることを特徴とする付記５に記載の判定プログラム。
（付記７）
前記コンピュータに、前記語句に対応付けられている宛先アドレスの数と送信元アドレスの数の合計が第３の閾値より大きい場合、前記語句を前記共通語句データベースに記憶する
処理をさらに実行させることを特徴とする付記１〜６のいずれかに記載の判定プログラム。
（付記８）
送信もしくは受信された電子メールに含まれている語句の出現頻度を、前記電子メールの宛先アドレスおよび送信元アドレスと対応付けて、語句データベースに記憶し、
送信される対象電子メールに含まれている語句のうちで、複数の電子メールに共通して用いられる語句を記録する共通語句データベースに含まれていない語句である対象語句を抽出すると共に、前記対象語句の総数を取得し、
前記対象語句の各々について、前記対象電子メールの宛先アドレスと対応付けられている前記出現頻度を第１の閾値と比較し、前記出現頻度が前記第１の閾値よりも大きい対象語句の数を取得し、
前記出現頻度が前記第１の閾値よりも大きい対象語句の数の前記総数に対する割合が第２の閾値未満の場合に、前記対象電子メールの送信は誤送信と判定する
処理をコンピュータが実行することを特徴とする判定方法。
（付記９）
送信または受信された電子メールに含まれている語句の出現頻度を、前記語句が含まれているメールの宛先アドレスおよび送信元アドレスと対応付けて記憶する語句データベースと、
複数の電子メールに共通して用いられる語句を記録する共通語句データベースと、
送信される対象電子メールに含まれている語句から前記共通語句データベースに含まれる語句を除いて得られた対象語句を抽出し、
前記対象語句の総数を取得し、
前記対象電子メールの宛先アドレスおよび前記対象電子メールの送信元アドレスと対応付けられている前記出現頻度が第１の閾値よりも大きい対象語句の数を取得すると共に、
前記出現頻度が前記第１の閾値よりも大きい対象語句の数の前記総数に対する割合が第２の閾値未満の場合に、前記対象電子メールは誤送信される可能性があると判定する判定部
を備えることを特徴とする通信装置。

１０通信装置
１１、１７受信部
１２送信部
１３電子メール作成部
１４電子メール分割部
１５、１８送信確認部
１６タイマ
２０記憶部
２１語句データベース
２２共通語句データベース
２３関連性データベース
３１辞書データ
３２、３４データ
４０判定部
４１本文誤り判定部
４２アドレス誤り判定部
５０データベース更新部
５１語句データベース更新部
５２共通語句データベース更新部
５３関連性データベース更新部
６１ＣＰＵ
６２メモリ
６３入力装置
６４出力装置
６５外部記憶装置
６６媒体駆動装置
６７可搬記憶媒体
６８ネットワーク接続装置
７０ネットワーク
８１アドレス
８２本文
９０誤送信判定装置
９１ユーザ端末
９２ＭＴＡ
９３ゲートウェイ
９４インターネット
９５誤送信防止サービスサーバ

Claims

送信もしくは受信された電子メールに含まれている語句の出現頻度を、前記電子メールの宛先アドレスおよび送信元アドレスと対応付けて、語句データベースに記憶し、
送信される対象電子メールに含まれている語句のうちで、複数の電子メールに共通して用いられる語句を記録する共通語句データベースに含まれていない語句である対象語句を抽出すると共に、前記対象語句の総数を取得し、
前記対象語句の各々について、前記対象電子メールの宛先アドレスと対応付けて前記語句データベースに記憶されている前記出現頻度を第１の閾値と比較し、前記出現頻度が前記第１の閾値よりも大きい対象語句の数を取得し、
前記出現頻度が前記第１の閾値よりも大きい対象語句の数の前記総数に対する割合が第２の閾値未満の場合に、前記対象電子メールの送信は誤送信と判定し、
誤送信と判定された第１の対象電子メールから抽出された対象語句を、前記第１の対象電子メールの宛先アドレスである第１のアドレスと、前記第１の対象電子メールの送信元アドレスである第２のアドレスとに対応付けて、修正前語句テーブルに記憶し、
前記第１の対象電子メールを修正して作成された第２の対象電子メールの送信が誤送信と判定されていない場合、
前記第２の対象電子メールから抽出された対象語句のうちで、前記修正前語句テーブルに記憶されている対象語句の出現頻度を大きくし、
前記第２の対象電子メールから抽出された対象語句ではなく、前記修正前語句テーブルに記憶されている対象語句の出現頻度を小さくする
処理をコンピュータに実行させることを特徴とする判定プログラム。
第１の宛先と第２の宛先とに同一の電子メールが送信される可能性を表す関連係数を、関連データベースに記憶し、
前記第１の宛先に送信される対象電子メールが前記第２の宛先にも送信される場合、前記関連係数が関連閾値以上であるかを確認し、
前記関連係数が前記関連閾値未満の場合、前記対象電子メールの送信は誤送信であると判定する
処理を前記コンピュータにさらに実行させることを特徴とする請求項１に記載の判定プログラム。
前記第１および第２の宛先を含む第１の対象電子メールの送信が誤送信と判定されると、前記第１の対象電子メールの宛先を修正前アドレステーブルに記憶し、
前記第１の対象電子メールを修正して作成された第２の対象電子メールの送信が誤送信と判定されていない場合、前記修正前アドレステーブルに記録されている前記第１の対象電子メールの宛先と、第２の対象電子メールの宛先を比較し、
前記修正前アドレステーブルに記録され、かつ、前記第２の対象電子メールの宛先に含まれていない宛先と、前記修正前アドレステーブルと前記第２の対象電子メールに共通する宛先との間の関連係数を小さくする
処理を前記コンピュータにさらに実行させることを特徴とする請求項２に記載の判定プログラム。
送信もしくは受信された電子メールに含まれている語句の出現頻度を、前記電子メールの宛先アドレスおよび送信元アドレスと対応付けて、語句データベースに記憶し、
送信される対象電子メールに含まれている語句のうちで、複数の電子メールに共通して用いられる語句を記録する共通語句データベースに含まれていない語句である対象語句を抽出すると共に、前記対象語句の総数を取得し、
前記対象語句の各々について、前記対象電子メールの宛先アドレスと対応付けて前記語句データベースに記憶されている前記出現頻度を第１の閾値と比較し、前記出現頻度が前記第１の閾値よりも大きい対象語句の数を取得し、
第１の宛先と第２の宛先とに同一の電子メールが送信される可能性を表す関連係数を、関連データベースに記憶し、
前記出現頻度が前記第１の閾値よりも大きい対象語句の数の前記総数に対する割合が第２の閾値未満の場合に、前記対象電子メールの送信は誤送信と判定するとともに、前記対象電子メールが前記第１および第２の宛先に送信される電子メールであり、かつ、前記関連係数が前記関連閾値未満の場合も、前記対象電子メールの送信は誤送信であると判定し、
前記第１および第２の宛先を含む第１の対象電子メールの送信が誤送信と判定されると、前記第１の対象電子メールの宛先を修正前アドレステーブルに記憶し、
前記第１の対象電子メールを修正して作成された第２の対象電子メールの送信が誤送信と判定されていない場合、前記修正前アドレステーブルに記録されている前記第１の対象電子メールの宛先と、第２の対象電子メールの宛先を比較し、
前記修正前アドレステーブルに記録され、かつ、前記第２の対象電子メールの宛先に含まれていない宛先と、前記修正前アドレステーブルと前記第２の対象電子メールに共通する宛先との間の関連係数を小さくする
処理をコンピュータに実行させることを特徴とする判定プログラム。
送信もしくは受信された電子メールに含まれている語句の出現頻度を、前記電子メールの宛先アドレスおよび送信元アドレスと対応付けて、語句データベースに記憶し、
送信される対象電子メールに含まれている語句のうちで、複数の電子メールに共通して用いられる語句を記録する共通語句データベースに含まれていない語句である対象語句を抽出すると共に、前記対象語句の総数を取得し、
前記対象語句の各々について、前記対象電子メールの宛先アドレスと対応付けられている前記出現頻度を第１の閾値と比較し、前記出現頻度が前記第１の閾値よりも大きい対象語句の数を取得し、
前記出現頻度が前記第１の閾値よりも大きい対象語句の数の前記総数に対する割合が第２の閾値未満の場合に、前記対象電子メールの送信は誤送信と判定し、
誤送信と判定された第１の対象電子メールから抽出された対象語句を、前記第１の対象電子メールの宛先アドレスである第１のアドレスと、前記第１の対象電子メールの送信元アドレスである第２のアドレスとに対応付けて、修正前語句テーブルに記憶し、
前記第１の対象電子メールを修正して作成された第２の対象電子メールの送信が誤送信と判定されていない場合、
前記第２の対象電子メールから抽出された対象語句のうちで、前記修正前語句テーブルに記憶されている対象語句の出現頻度を大きくし、
前記第２の対象電子メールから抽出された対象語句ではなく、前記修正前語句テーブルに記憶されている対象語句の出現頻度を小さくする
処理をコンピュータが実行することを特徴とする判定方法。
送信または受信された電子メールに含まれている語句の出現頻度を、前記語句が含まれているメールの宛先アドレスおよび送信元アドレスと対応付けて記憶する語句データベースと、
複数の電子メールに共通して用いられる語句を記録する共通語句データベースと、
送信される対象電子メールに含まれている語句から前記共通語句データベースに含まれる語句を除いて得られた対象語句を抽出し、
前記対象語句の総数を取得し、
前記対象電子メールの宛先アドレスおよび前記対象電子メールの送信元アドレスと対応付けられている前記出現頻度が第１の閾値よりも大きい対象語句の数を取得すると共に、
前記出現頻度が前記第１の閾値よりも大きい対象語句の数の前記総数に対する割合が第２の閾値未満の場合に、前記対象電子メールは誤送信される可能性があると判定する判定部と、
誤送信と判定された第１の対象電子メールから抽出された対象語句を、前記第１の対象電子メールの宛先アドレスである第１のアドレスと、前記第１の対象電子メールの送信元アドレスである第２のアドレスとに対応付けて記憶する修正前語句テーブルと、
前記第１の対象電子メールを修正して作成された第２の対象電子メールの送信が誤送信と判定されていない場合、前記第２の対象電子メールから抽出された対象語句のうちで、前記修正前語句テーブルに記憶されている対象語句の出現頻度を大きくするとともに、前記第２の対象電子メールから抽出された対象語句ではなく、前記修正前語句テーブルに記憶されている対象語句の出現頻度を小さくする語句データベース更新部
を備えることを特徴とする通信装置。