PHP程序如何解決大量數(shù)據(jù)循環(huán)時的內(nèi)存不足問題
在做PHP開發(fā)的時候,有一些較大的數(shù)組做循環(huán)時會經(jīng)常報一些內(nèi)存不足的問題,例如下面的這條:
PHP Fatal error: Allowed memory size of 268 435 456 bytes exhausted
錯誤信息顯示允許的最大內(nèi)存已經(jīng)耗盡。遇到這樣的錯誤起初讓我很詫異,寫PHP程序這么多年,基本從來沒有怎么考慮過內(nèi)存不足的問題,但轉(zhuǎn)眼一想,直接接觸的大多是數(shù)據(jù)量比較小,而我正在開發(fā)的這個程序是要用一個foreach循環(huán)語句在一個有十萬多條記錄的表里全表搜索具有特定特征的數(shù)據(jù),也就是說,一次要把十萬多條數(shù)據(jù)取出,然后逐條檢查每天數(shù)據(jù)。可想而知,十萬多條數(shù)據(jù)全部加載到內(nèi)存中,內(nèi)存不爆才怪。
畢竟編程這么多年,我隱約記得PHP里提供有非一次全部加載數(shù)據(jù)的API,是像處理流媒體那樣,隨用隨取隨丟、數(shù)據(jù)并不會積累在內(nèi)存的查詢方法。經(jīng)過簡單的搜索,果然在官方網(wǎng)站上找到的正確的用法。
這個問題在PHP的官方網(wǎng)站上叫緩沖查詢和非緩沖查詢(Buffered and Unbuffered queries)。PHP的查詢?nèi)笔∧J绞蔷彌_模式。也就是說,查詢數(shù)據(jù)結(jié)果會一次全部提取到內(nèi)存里供PHP程序處理。這樣給了PHP程序額外的功能,比如說,計算行數(shù),將指針指向某一行等。更重要的是程序可以對數(shù)據(jù)集反復(fù)進行二次查詢和過濾等操作。但這種緩沖查詢模式的缺陷就是消耗內(nèi)存,也就是用空間換速度。
相對的,另外一種PHP查詢模式是非緩沖查詢,數(shù)據(jù)庫服務(wù)器會一條一條的返回數(shù)據(jù),而不是一次全部返回,這樣的結(jié)果就是PHP程序消耗較少的內(nèi)存,但卻增加了數(shù)據(jù)庫服務(wù)器的壓力,因為數(shù)據(jù)庫會一直等待PHP來取數(shù)據(jù),一直到數(shù)據(jù)全部取完。
很顯然,緩沖查詢模式適用于小數(shù)據(jù)量查詢,而非緩沖查詢適應(yīng)于大數(shù)據(jù)量查詢。
對于PHP的緩沖模式查詢大家都知道,下面列舉的例子是如何執(zhí)行非緩沖查詢API。
非緩沖查詢方法一:mysqli
<?php
$mysqli = new mysqli("localhost", "my_user", "my_password", "world");
$uresult = $mysqli->query("SELECT Name FROM City", MYSQLI_USE_RESULT);
if ($uresult) {
while ($row = $uresult->fetch_assoc()) {
echo $row['Name'] . PHP_EOL;
}
}
$uresult->close();
?>
非緩沖查詢方法二:pdo_mysql
<?php
$pdo = new PDO("mysql:host=localhost;dbname=world", 'my_user', 'my_pass');
$pdo->setAttribute(PDO::MYSQL_ATTR_USE_BUFFERED_QUERY, false);
$uresult = $pdo->query("SELECT Name FROM City");
if ($uresult) {
while ($row = $uresult->fetch(PDO::FETCH_ASSOC)) {
echo $row['Name'] . PHP_EOL;
}
}
?>
非緩沖查詢方法三:mysql
<?php
$conn = mysql_connect("localhost", "my_user", "my_pass");
$db = mysql_select_db("world");
$uresult = mysql_unbuffered_query("SELECT Name FROM City");
if ($uresult) {
while ($row = mysql_fetch_assoc($uresult)) {
echo $row['Name'] . PHP_EOL;
}
}
?>