Startseite LUG Untermain

Startseite
 
Über uns
Stammtisch
 
Über Linux
SW-Patente
Rezensionen
 
Mailingliste
Online-Mail-Archiv
 
LUG-IRC Channel
LUG-IRC Statistik-NEU-
 
Gästebuch
 
Arbeitsgruppen
Softwaredownloads
Vorträge
FAQ & Hints
HOWTOs
Doku-Wiki -NEU-
 
LUG-Kalender
Links
 
Blog
LUGUM-Planet


hosted by
logo

User-Bereich
(passwortgeschützt)
Passwort vergessen?
150 Mitglieder

Anmelden - HIER -






Re: Teilstrings aus Textdatei extrahieren?

Re: Teilstrings aus Textdatei extrahieren?

Autor: Jörg Schütter <joerg_at_schuetter.org>
Datum: Fr 08 Jan 2010 - 09:06:20 CET

Hallo Sebastian,

On Thu, 07 Jan 2010 22:28:10 +0100
Sebastian Suchanek <sebastian.suchanek@gmx.de> wrote:

> Hallo Liste!
>
> Haben wir zufällig (Shell|AWK|...)-Skript-Götter unter uns? :-)
> Ich hätte da folgende Problemstellung: Gegeben sei eine Textdatei, in
> der zigfach der Teilstring "[img]$URL[/img]" (statt "$URL" steht da
> natürlich eine "richtige" URL...) vorkommt. Das Vorkommen kann keinmal,
> einmal oder evtl. auch mehrfach pro Zeile sein.

grep -o '\[img\][^\[]*\[/img\]' QUELLDATEI | \
sed -e 's#\[img\]##' -e 's#\[/img\]##' | \
sort -u

Die sed-Zeile ist noch stark verbesserungswürdig.
>
> Was ich haben möchte, sind alle URLs, am liebsten in einer zweiten
> Textdatei, mit einer URL pro Zeile. Mehrfachnennungen ein- und derselben
> URL wäre nicht dramatisch. Auch das Mehrfachvorkommen pro Zeile in der
> Ursprungsdatei ist extrem unwahrscheinlich, müsste also nicht unbedingt
> berücksichtigt werden. (Wäre nur schön, wenn.)
>
> Also: Wer hat konkrete Lösungsvorschläge, wie man das am besten löst? :-)

Viele Wege führen nach Rom ;-)

Joerg
Received on Fri Jan 8 09:06:21 2010


Disclaimer
Impressum


News
- Update für Opera 10.6
 
- Amazon baut Content-Geschäft aus
 
- Startschuss für Bundeswettbewerb Informatik
 
- Solaris Studio 12.2 verbessert Fehlersuche
 
- Finanzgericht: Steuer-ID nicht verfassungswidrig
 
- Bunter Reigen: Spiegelreflex K-r und zwei Kompakte von Pentax
 
- Studie: Internet ist für Jugendliche wichtigstes Leitmedium
 
- Adobe warnt vor Zero-Day-Lücke in Reader und Acrobat
 
- Patientengeführte Online-Gesundheitsakte erfüllt nicht alle Erwartungen
 
- Neue Richtlinien für Breitband-Ausbau in Österreich