spesk1 4 лет назад
Родитель
Сommit
42167adc28
2 измененных файлов с 166 добавлено и 3 удалено
  1. 9 3
      parse.pl
  2. 157 0
      seed_data.txt

+ 9 - 3
parse.pl

@@ -9,10 +9,16 @@ use warnings;
 my @page = split("\n", `cat saints.html`);
 
 foreach my $line ( @page ) {
-	if ( $line =~ m/<td data-sort-value=.*<a\ href=.*title="(.*)"/ ) {
+	if ( $line =~ m/title="(.*)">.*/ ) {
 		my $line1 = $1;
-		if ( $line1 =~ m/^([a-zA-z0-9\ ,-]{1,})/ ) {
-			print "$1\n";
+		if ( $line1 =~ m/ctx/ ) {
+			next;
+		} else {
+			print "$line1\n";
 		}
+		
+		#if ( $line1 =~ m/^([a-zA-z0-9\ ,-]{1,})/ ) {
+		#	print "$1\n";
+		#}
 	}
 }

Разница между файлами не показана из-за своего большого размера
+ 157 - 0
seed_data.txt


Некоторые файлы не были показаны из-за большого количества измененных файлов