ANZEIGE
Meine Idee wäre, eine Art "Hierarchie" zu definieren, nach der Daten aus dem File extrahiert werden:Anstatt zu jammern denke ich das jetzt mal laut weiter:
die meisten User posten ein einigermaßen sinnvolles subject in die Gruppe:
"subject": "ACARS log, Maastricht - The Netherlands, 21/Sep/2009 00:00 - 21/Sep/2009 23:59",
dazu gibt es noch das postdate in epoch
"postDate": "1253570463",
Meine Suchmethode wäre schon deutlich erleichtert wenn ich mir das subject aus dem File ziehen könnte, und das entsprechende File umbenenne von
28241_raw.json
-> ACARS log, Maastricht - The Netherlands, 21/Sep/2009 00:00 - 21/Sep/2009 23:59.json
(und das dann noch schön normalisiere in Richtung "ersetze Space durch _ und mach ein pretty print für dateTime"
-> ACARS_log_Maastricht_-_The_Netherlands_20090921_0000-20090921_2359.json
wäre ein wunderbar sinnvoll nutzbares Files für eine RegEx search all Suche.
ich hab hier ein paar Batch-Rename utilities ausprobiert aber noch keines gefunden dass Teile des contents für den Namen verwenden könnte?
Oder gibt es entsprechende Grep / rename Kommandos in bash oder (ich eher Windows) Powershell?
- Erste Zeile des Logs (z.B. ACARS LOG 0000 *20060102* to 2359 20060102), d.h. der "Header" wenn das Log mit z.B. acarsd erstellt wurde
- Datum aus Logeinträgen (N642RW (E170 TCF) 0000 *20060102* S57624 (ORD-HPN))
- Datum aus Betreff der Mail parsen
Dazu wird es aber ein paar Zeilen Code in einer beliebigen Programmiersprache (zur Not auch Bash) brauchen. Kann ich aber gerne für dich machen
Die Sachen in eine Datenbank zu packen habe ich mir auch schon überlegt, allerdings mache ich mir da Sorgen, den Überblick zu verlieren und Änderungen nicht ordentlich tracken zu können. Meine Textfiles habe ich unter Versionskontrolle. Außerdem ist die Datenmenge bei mir ziemlich groß, was wieder andere Probleme bereitet.