dizzyk έγραψε:ergoil, κοιτούσα κι εγώ αν υπάρχει στο site της Βουλής τρόπος να βλέπουμε τα σχέδια νόμου που κατατίθενται προς ψήφιση, αλλά πχ το rss που έδωσες και είχα δει, πέρα από το 5/4/12 και το 19/3/12, η προηγούμενη εγγραφή είναι 4/6/2010...
Το παρατήρησα και εγώ, ότι δεν αλλάζει.


Ευτυχώς υπάρχει και το εβδομαδιαίο δελτίο. Εκεί υπάρχει όλη η πληροφορία που χρειαζόμαστε. Αν υπάρχει και πουθενά αλλού πιο εύκολα, καλώς. Αν δεν υπάρχει όμως, τότε πρέπει:
1) να περαστεί το pdf δελτίο από ένα pdf distiller για να γίνει text.
2) να μπορέσει να γίνει το κατάλληλο parsing (μάλλον με χρήση της awk) έτσι ώστε να εξαχθεί η χρήσιμη πληροφορία.
οπότε, ερώτηση πρώτη: ξέρει κανείς κάποιον καλό pdf distiller;
Το ιδανικό θα ήταν, επειδή το εβδομαδιαίο δελτίο είναι δίστηλο, να μπορεί o distiller να παράγει ένα doc κείμενο με δύο στήλες-columns. Έτσι ώστε στην συνέχεια να το αλλάξουμε σε μια στήλη. Αυτό θα βοηθούσε πολύ τον προγραμματισμό στην awk.