spesk1 преди 4 години
родител
ревизия
42167adc28
променени са 2 файла, в които са добавени 166 реда и са изтрити 3 реда
  1. 9 3
      parse.pl
  2. 157 0
      seed_data.txt

+ 9 - 3
parse.pl

@@ -9,10 +9,16 @@ use warnings;
 my @page = split("\n", `cat saints.html`);
 
 foreach my $line ( @page ) {
-	if ( $line =~ m/<td data-sort-value=.*<a\ href=.*title="(.*)"/ ) {
+	if ( $line =~ m/title="(.*)">.*/ ) {
 		my $line1 = $1;
-		if ( $line1 =~ m/^([a-zA-z0-9\ ,-]{1,})/ ) {
-			print "$1\n";
+		if ( $line1 =~ m/ctx/ ) {
+			next;
+		} else {
+			print "$line1\n";
 		}
+		
+		#if ( $line1 =~ m/^([a-zA-z0-9\ ,-]{1,})/ ) {
+		#	print "$1\n";
+		#}
 	}
 }

Файловите разлики са ограничени, защото са твърде много
+ 157 - 0
seed_data.txt


Някои файлове не бяха показани, защото твърде много файлове са промени