lucene-solr-user mailing list archives

Site index · List index
Message view « Date » · « Thread »
Top « Date » · « Thread »
From Jörg Agatz <joerg.ag...@googlemail.com>
Subject question about indexing...
Date Tue, 25 May 2010 14:06:36 GMT
I have a work!,
i musst indexing a lot of E-Mails, so i will create a Script to generate me
a xml of the Mails.

Now is the question, what happens when i creade a field "body" and in this
field comes a lot of "<" or ">" like this:
Confidentiality Caution: This message and all its included content and

assets are confidential and for the individual use of the entity to
whom it is send to only. If you, the reader of this message, have
recieved this communication by error please notify me about this
immediately, by return address, and delete the message and its assets.
Thank you.
> Apropos: In eurem Footer scheint ein "r" zu fehlen (Headqua_r_ter).
>
> Snapt Pty Ltd: Stephan Plesnik schrieb:
>>
>> Headquaters:

>

> --------------------------------------------------------------------
> Diese E-Mail, einschließlich sämtlicher mit ihr übertragenen Dateie
> n,
> ist vertraulich und ist für die ausschließliche Verwendung durch die
> Person oder das Unternehmen vorgesehen, an die/das sie adressiert ist.
> Sollten Sie diese E-Mail fälschlicherweise erhalten haben,
> benachrichtigen Sie bitte unseren Systemverwalter
> (service@plesnik.de).
> Diese E-Mail wurde auf die Abwesenheit von Computerviren überprüft.
> ---
> --------------------------------------------------------------------

Or

<hallo Mr. xy>
<thanks for greats>
<dear Mr. xyz>


I think it dosen´t Work!
howcan i make it, so that each content inpuit in the Solr

Mime
  • Unnamed multipart/alternative (inline, None, 0 bytes)
View raw message