AS ConvertBox - Die Analyse

Wenn Sie bereits etwas durch unsere Website geblättert haben sind Ihnen sicherlich schon häufiger Begriffe wie wissens- und regelbasierte Analyse und Interpretation begegnet. Da diese Vorabanalyse die eigentliche Grundlage für eine hochqualitative, treffsichere und fehlertolerante Identifikation ist, erklären wir hier ausführlich, was wir darunter verstehen und wie wir diese Vorgabe umsetzen. Bedenken Sie, dass nur eine detailgenaue Analyse und Interpretation aller Adressbestandteile verhindert, dass „Äpfel mit Birnen“ verglichen werden. Wissens- und regelbasierte Analyse und Interpretation ist bei uns kein Marketingschlagwort sondern eine gelebte Philosophie.


Analyseaufbau

Das Besondere an unseren Basiskomponenten ist die vorgeschaltete, detailgenaue Analyse aller Bestandteile eines Namens, z. B. Firmeneigennamen (z. B. Oracle, Delta V, Microsoft, etc.), Firmenidentifikatoren (z. B. "Bank", "Versicherung", "EDV", "Service", etc.), Ortsangaben (z. B. "Düsseldorfer", "Köln", "Deutschland"), Rechtsformen (z. B. "GmbH", "AG", "GbR", etc.) und aller anderen Bestandteile, die in Firmennamen vorkommen können, auf Basis einer großen Wissens- und Regeldatenbank, die eine effiziente, performante, fehlertolerante Analyse gewährleistet. Das gleiche Verfahren funktioniert natürlich genauso auf Basis privatpersonenrelevanter Informationen (z. B. Vor- & Nachnamenslisten, Titel, Anrede, Präfix, Suffixe, Berufe, etc.). Die erwähnten Wissens- & Regeldatenbanken enthalten dabei EU-weites Wissen und werden insbesondere auch auf internationale Datenbestände optimiert.



Die Anlyse von Namen

Das Ergebnis der Analyse der Namensdaten ist eine Zeichenkette, in der alle Namensbestandteile mit ihrer Bedeutung in normalisierter Form abgelegt werden. Als Eingabeparameter wird lediglich der Originalname – d. h. die Aneinanderkettung aller Namenselemente aus dem Adressbestand – übergeben. Die Analyse identifiziert automatisch die Bestandteile von Personen- oder Firmennamen.

Beispiel 1

Eingabe : Herr Graf Dipl.-Ing. Hans-Josef von Thun und Hohenstein sr.

Ausgabe :

herr

Anrede

graf

Adelstitel

dipl ing

Akademischer Titel

hans-josef

Vorname

von

Präfix

thun und hohenstein

Nachname

sr

Suffix




Beispiel 2

Eingabe : T & A Systemgesell. f. DV-Integration mbH

Ausgabe :

ta

mögliches Akronym

system

Firmenwort

gesell

Teil der Gesellschaftsform GmbH

f

Abkürzung

DV

mögliches Akronym

integration

Firmenwort

mbh

Teil der Gesellschaftsform GmbH




Vorabanalyse der Namensbestandteile

Der Namensvergleich wird in einem mehrstufigen Verfahren durchgeführt und berücksichtigt u. a. ob zwei Privatpersonen, zwei Organisationen oder eine Privatperson mit einer Organisation verglichen werden. Dabei erkennt die AS MearchBox bei der Vorabanalyse mit einer extrem hohen Trefferwahrscheinlichkeit, ob es sich bei einem Datensatz um eine Organisation oder eine (bzw. mehrere) Privatperson(en) handelt. Diese Vorabanalyse versucht auch sofort alle Bestandteile eines Namens zu erkennen.


Bei Privatpersonen werden u. a. die folgenden, möglichen Bestandteile eines Namens erkannt:

Anrede bzw. Titulatur

„Herr“,„Frau“, „Eheleute“, „Familie“, etc.

Titel

„Prof. Dr.“, „Dipl.-Stat.“, „General“, etc.

Präfixe

„von den“, „van der“, „del“, etc.

Vornamen

„Hans-Peter“, „Erwin“, etc.

Initial

„HPB van den Bosch“ ==> „H.P.B. sind Initiale“

Nachnamen

auch zusammengehörende Nachnamen

Suffixe

z. B. „sr.“ oder „jun.“

Berufe




Bei Organisationen werden u. a. die folgenden möglichen Bestandteile eines Namens erkannt:

Firmeneigenname

z. B. „Address Solutions“, „Oracle“, „Microsoft“, etc.

Firmentätigkeitsworte
 

z. B. „Versicherung“, „Immobilien“, „Beratung“, „Software“, „Gartenbau“, „Lebensmittel“, etc.

Firmenwortsplittung
 

z. B. „Immobilienberatung“ ==> „Immobilie“, „Beratung“, „Kindertagesstätte“ ==> „Kind“, „Tag“, „Stätte“

Erkennung von Plural und Standardisierung auf Singular

 
 
 

Erkennung und Separierung der Gesellschaftsform

z. B. „Müller Beratungsges. f. Immobilien mbH und CoKG“ ==> „GmbH & Co.KG“, „Albert Einstein Stift.“ ==> „Stiftung“, etc.

Geografische Begriffe
 

z. B. „München“, „Asien“, „Gerolsteiner“, „Brabantse“, „New York“, etc.

privatpersonenrelevante Bestandteile, die auch in Organisationsnamen vorkommen können

 
 
 
 

Erkennung von Akronymen

z. B. „AIB Aachener Immobilienberatung“