本文我們學習如何用Perl對字符串或者數(shù)字數(shù)組進行排序。
Perl有個內(nèi)置函數(shù)叫做sort毫無疑問的可以排序一個數(shù)組。 其最簡單的形式是傳遞一個數(shù)組,它會返回排序后的元素組成的數(shù)組。@sorted = sort @original。
基于ASCII碼排序
復制代碼 代碼如下:
#!/usr/bin/perl
use strict;
use warnings;
use 5.010;
use Data::Dumper qw(Dumper);
my @words = qw(foo bar zorg moo);
say Dumper \@words;
my @sorted_words = sort @words;
say Dumper \@sorted_words;
上邊的例子將會打印
復制代碼 代碼如下:
$VAR1 = [
'foo',
'bar',
'zorg',
'moo'
];
$VAR1 = [
'bar',
'foo',
'moo',
'zorg'
];
第一個輸出顯示了排序前的數(shù)組,第二個是排序后的。
這是最簡單的情形,但是可能未必是你想要的。 比如,如果一些單詞以大寫字母開頭怎么辦?
復制代碼 代碼如下:
my @words = qw(foo bar Zorg moo);
@sorted_names里的結(jié)果將是:
復制代碼 代碼如下:
$VAR1 = [
'Zorg',
'bar',
'foo',
'moo'
];
你會發(fā)現(xiàn),以大寫字母開頭的單詞排在了第一位。 這是因為sort默認根據(jù)ASCII碼表排序,所有的大寫字母都排在小寫字母前邊。
比較函數(shù)
Perl的sort的工作方式是這樣的,它遍歷原始數(shù)組的每兩個元素;每次把左邊的值放入變量$a,把右邊的值放入變量$b。 然后調(diào)用比較函數(shù)。如果$a的內(nèi)容應該在左邊的話,“比較函數(shù)”會返回1;如果$b應該在左邊的話,返回-1,兩者一樣的話,返回0。
通常你看不到比較函數(shù),sort會根據(jù)ASCII碼表對值進行比較,不過如果你想的話,你可以顯式的寫出來:
復制代碼 代碼如下:
sort { $a cmp $b } @words;
這段代碼會跟沒有使用塊的sort @words達到同樣的效果。
這里你可以看到,默認perl使用cmp作為比較函數(shù)。這是因為正是cmp可以做這里邊我們需要的工作。 它比較兩邊的字符串的值,如果左邊參數(shù)“小于”右邊參數(shù),就返回1;如果左邊參數(shù)“大于”右邊參數(shù),就返回-1;如果相等,就返回0。
按字母順序排列
如果你想忽略字符串的大小寫來排序——即通常所謂的字母序,你可以像下一個例子這么做:
復制代碼 代碼如下:
my @sorted_words = sort { lc($a) cmp lc($b) } @words;
這里為了比較,我們調(diào)用lc函數(shù)返回參數(shù)的小寫版本。然后cmp比較這些小寫版本并決定原始字符串誰先誰后。
結(jié)果是
復制代碼 代碼如下:
$VAR1 = [
'bar',
'foo',
'moo',
'Zorg'
];
Perl對數(shù)值排序
如果對數(shù)值數(shù)組使用sort進行默認的排序,結(jié)果可能不是我們期望的。
復制代碼 代碼如下:
my @numbers = (14, 3, 12, 2, 23);
my @sorted_numbers = sort @numbers;
say Dumper \@sorted_numbers;
$VAR1 = [
12,
14,
2,
23,
3
];
仔細一想的話,這并不奇怪。比較函數(shù)看到12和3時,它按字符串進行比較。這意味著比較兩個字符串的第一個字符"1"和"3"。 在ASCII碼表里,"1"在"3"前邊,因此字符串"12"會排在字符串"3"前面。
Perl不會很神奇地猜到你想按數(shù)字對這些值排序。
盡管我們可以寫一個比較函數(shù)來按數(shù)字比較兩個值。但這里我們使用=>(也被稱作宇宙飛船操作符), 它會按數(shù)字來比較兩個參數(shù)并返回1、-1或者0。
復制代碼 代碼如下:
my @sorted_numbers = sort { $a => $b } @numbers;
結(jié)果是:
復制代碼 代碼如下:
$VAR1 = [
2,
3,
12,
14,
23
];