php常见细节错误

PHP编程中10个最多见的错误

PHP是一种很是流行的开源服务器端脚本语言,你在万维网看到的大多数网站都是使用php开发的。本篇经将为你们介绍PHP开发中10个最多见的问题,但愿可以对朋友有所帮助。php

 错误1:foreach循环后留下悬挂指针

  在foreach循环中,若是咱们须要更改迭代的元素或是为了提升效率,运用引用是一个好办法:html

1
2
3
4
5
$arr = array (1, 2, 3, 4);
foreach ( $arr as & $value ) {
    $value = $value * 2;
}
// $arr is now array(2, 4, 6, 8)

  这里有个问题不少人会迷糊。循环结束后,$value并未销毁,$value实际上是数组中最后一个元素的引用,这样在后续对$value的使用中,若是不知道这一点,会引起一些莫名奇妙的错误:)看看下面这段代码:java

1
2
3
4
5
6
7
8
$array = [1, 2, 3];
echo implode( ',' , $array ), "\n" ;
 
foreach ( $array as & $value ) {}     // by reference
echo implode( ',' , $array ), "\n" ;
 
foreach ( $array as $value ) {}     // by value (i.e., copy)
echo implode( ',' , $array ), "\n" ;

  上面代码的运行结果以下:mysql

1
2
3
1,2,3
1,2,3
1,2,2

  你猜对了吗?为何是这个结果呢?ajax

  咱们来分析下。第一个循环事后,$value是数组中最后一个元素的引用。第二个循环开始:sql

  • 第一步:复制$arr[0]到$value(注意此时$value是$arr[2]的引用),这时数组变成[1,2,1]
  • 第二步:复制$arr[1]到$value,这时数组变成[1,2,2]
  • 第三步:复制$arr[2]到$value,这时数组变成[1,2,2]

  综上,最终结果就是1,2,2数据库

  避免这种错误最好的办法就是在循环后当即用unset函数销毁变量:编程

1
2
3
4
5
$arr = array (1, 2, 3, 4);
foreach ( $arr as & $value ) {
    $value = $value * 2;
}
unset( $value );   // $value no longer references $arr[3]

 错误2:对isset()函数行为的错误理解

  对于isset()函数,变量不存在时会返回false,变量值为null时也会返回false。这种行为很容易把人弄迷糊。。。看下面的代码:json

1
2
3
4
$data = fetchRecordFromStorage( $storage , $identifier );
if (!isset( $data [ 'keyShouldBeSet' ]) {
    // do something here if 'keyShouldBeSet' is not set
}

  写这段代码的人本意多是若是$data['keyShouldBeSet']未设置,则执行对应逻辑。但问题在于即便$data['keyShouldBeSet']已设置,但设置的值为null,仍是会执行对应的逻辑,这就不符合代码的本意了。数组

  下面是另一个例子:

1
2
3
4
5
6
7
8
9
if ( $_POST [ 'active' ]) {
    $postData = extractSomething( $_POST );
}
 
// ...
 
if (!isset( $postData )) {
    echo 'post not active' ;
}

  上面的代码假设$_POST['active']为真,那么$postData应该被设置,所以isset($postData)会返回 true。反之,上 面代码假设isset($postData)返回false的惟一途径就是$_POST['active']也返回false。

  真是这样吗?固然不是!

  即便$_POST['active']返回true,$postData也有可能被设置为null,这时isset($postData)就会返回false。这就不符合代码的本意了。

  若是上面代码的本意仅是检测$_POST['active']是否为真,下面这样实现会更好:

1
2
3
4
5
6
7
8
9
if ( $_POST [ 'active' ]) {
    $postData = extractSomething( $_POST );
}
 
// ...
 
if ( $_POST [ 'active' ]) {
    echo 'post not active' ;
}

  判断一个变量是否真正被设置(区分未设置和设置值为null),array_key_exists()函数或许更好。重构上面的第一个例子,以下:

1
2
3
4
$data = fetchRecordFromStorage( $storage , $identifier );
if (! array_key_exists ( 'keyShouldBeSet' , $data )) {
    // do this if 'keyShouldBeSet' isn't set
}

  另外,结合get_defined_vars()函数,咱们能够更加可靠的检测变量在当前做用域内是否被设置:

1
2
3
if ( array_key_exists ( 'varShouldBeSet' , get_defined_vars())) {
    // variable $varShouldBeSet exists in current scope
}

 错误3:混淆返回值和返回引用

  考虑下面的代码:

1
2
3
4
5
6
7
8
9
10
11
12
13
class Config
{
    private $values = [];
 
    public function getValues() {
        return $this ->values;
    }
}
 
$config = new Config();
 
$config ->getValues()[ 'test' ] = 'test' ;
echo $config ->getValues()[ 'test' ];

  运行上面的代码,将会输出下面的内容:

1
PHP Notice:  Undefined index: test in /path/to/my/script.php on line 21

  问题出在哪呢?问题就在于上面的代码混淆了返回值和返回引用。在PHP中,除非你显示的指定返回引用,不然对于数组PHP是值返回,也就是数组的拷贝。所以上面代码对返回数组赋值,实际是对拷贝数组进行赋值,非原数组赋值。

1
2
3
4
5
6
7
// getValues() returns a COPY of the $values array, so this adds a 'test' element
// to a COPY of the $values array, but not to the $values array itself.
$config ->getValues()[ 'test' ] = 'test' ;
 
// getValues() again returns ANOTHER COPY of the $values array, and THIS copy doesn't
// contain a 'test' element (which is why we get the "undefined index" message).
echo $config ->getValues()[ 'test' ];

  下面是一种可能的解决办法,输出拷贝的数组,而不是原数组:

1
2
3
$vals = $config ->getValues();
$vals [ 'test' ] = 'test' ;
echo $vals [ 'test' ];

  若是你就是想要改变原数组,也就是要反回数组引用,那应该如何处理呢?办法就是显示指定返回引用便可:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
class Config
{
    private $values = [];
 
    // return a REFERENCE to the actual $values array
    public function &getValues() {
        return $this ->values;
    }
}
 
$config = new Config();
 
$config ->getValues()[ 'test' ] = 'test' ;
echo $config ->getValues()[ 'test' ];

  通过改造后,上面代码将会像你指望那样会输出test。

  咱们再来看一个例子会让你更迷糊的例子:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
class Config
{
    private $values ;
 
    // using ArrayObject rather than array
    public function __construct() {
        $this ->values = new ArrayObject();
    }
 
    public function getValues() {
        return $this ->values;
    }
}
 
$config = new Config();
 
$config ->getValues()[ 'test' ] = 'test' ;
echo $config ->getValues()[ 'test' ];

  若是你想的是会和上面同样输出“ Undefined index”错误,那你就错了。代码会正常输出“test”。缘由在于PHP对于对象默认就是按引用返回的,而不是按值返回。

  综上所述,咱们在使用函数返回值时,要弄清楚是值返回仍是引用返回。PHP中对于对象,默认是引用返回,数组和内置基本类型默认均按值返回。这个要与其它语言区别开来(不少语言对于数组是引用传递)。

  像其它语言,好比java或C#,利用getter或setter来访问或设置类属性是一种更好的方案,固然PHP默认不支持,须要本身实现:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
class Config
{
    private $values = [];
 
    public function setValue( $key , $value ) {
        $this ->values[ $key ] = $value ;
    }
 
    public function getValue( $key ) {
        return $this ->values[ $key ];
    }
}
 
$config = new Config();
 
$config ->setValue( 'testKey' , 'testValue' );
echo $config ->getValue( 'testKey' );     // echos 'testValue'

  上面的代码给调用者能够访问或设置数组中的任意值而不用给与数组public访问权限。感受怎么样:)

 错误4:在循环中执行sql查询

  在PHP编程中发现相似下面的代码并很多见:

1
2
3
4
5
$models = [];
 
foreach ( $inputValues as $inputValue ) {
    $models [] = $valueRepository ->findByValue( $inputValue );
}

  固然上面的代码是没有什么错误的。问题在于咱们在迭代过程当中$valueRepository->findByValue()可能每次都执行了sql查询:

1
$result = $connection ->query( "SELECT `x`,`y` FROM `values` WHERE `value`=" . $inputValue );

  若是迭代了10000次,那么你就分别执行了10000次sql查询。若是这样的脚本在多线程程序中被调用,那极可能你的系统就挂了。。。

  在编写代码过程当中,你应该要清楚何时应该执行sql查询,尽量一次sql查询取出全部数据。

  有一种业务场景,你极可能会犯上述错误。假设一个表单提交了一系列值(假设为IDs),而后为了取出全部ID对应的数据,代码将遍历IDs,分别对每一个ID执行sql查询,代码以下所示:

1
2
3
4
5
$data = [];
foreach ( $ids as $id ) {
    $result = $connection ->query( "SELECT `x`, `y` FROM `values` WHERE `id` = " . $id );
    $data [] = $result ->fetch_row();
}

  但一样的目的能够在一个sql中更加高效的完成,代码以下:

1
2
3
4
5
6
7
$data = [];
if ( count ( $ids )) {
    $result = $connection ->query( "SELECT `x`, `y` FROM `values` WHERE `id` IN (" . implode( ',' , $ids ));
    while ( $row = $result ->fetch_row()) {
        $data [] = $row ;
    }
}

 错误5:内存使用低效和错觉

  一次sql查询获取多条记录比每次查询获取一条记录效率确定要高,但若是你使用的是php中的mysql扩展,那么一次获取多条记录就极可能会致使内存溢出。

  咱们能够写代码来实验下(测试环境: 512MB RAM、MySQL、php-cli):

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
// connect to mysql
$connection = new mysqli( 'localhost' , 'username' , 'password' , 'database' );
 
// create table of 400 columns
$query = 'CREATE TABLE `test`(`id` INT NOT NULL PRIMARY KEY AUTO_INCREMENT' ;
for ( $col = 0; $col < 400; $col ++) {
    $query .= ", `col$col` CHAR(10) NOT NULL" ;
}
$query .= ');' ;
$connection ->query( $query );
 
// write 2 million rows
for ( $row = 0; $row < 2000000; $row ++) {
    $query = "INSERT INTO `test` VALUES ($row" ;
    for ( $col = 0; $col < 400; $col ++) {
        $query .= ', ' . mt_rand(1000000000, 9999999999);
    }
    $query .= ')' ;
    $connection ->query( $query );
}

  如今来看看资源消耗:

1
2
3
4
5
6
7
8
9
// connect to mysql
$connection = new mysqli( 'localhost' , 'username' , 'password' , 'database' );
echo "Before: " . memory_get_peak_usage() . "\n" ;
 
$res = $connection ->query( 'SELECT `x`,`y` FROM `test` LIMIT 1' );
echo "Limit 1: " . memory_get_peak_usage() . "\n" ;
 
$res = $connection ->query( 'SELECT `x`,`y` FROM `test` LIMIT 10000' );
echo "Limit 10000: " . memory_get_peak_usage() . "\n" ;

  输出结果以下:

1
2
3
Before: 224704
Limit 1: 224704
Limit 10000: 224704

  根据内存使用量来看,貌似一切正常。为了更加肯定,试着一次获取100000条记录,结果程序获得以下输出:

1
2
PHP Warning:  mysqli::query(): (HY000/2013):
              Lost connection to MySQL server during query in /root/test.php on line 11

  这是怎么回事呢?

  问题出在php的mysql模块的工做方式,mysql模块实际上就是libmysqlclient的一个代理。在查询获取多条记录的同时,这 些记录会直接 保存在内存中。因为这块内存不属于php的内存模块所管理,因此咱们调用memory_get_peak_usage()函数所得到的值并不是真实使用内存 值,因而便出现了上面的问题。

  咱们可使用mysqlnd来代替mysql,mysqlnd编译为php自身扩展,其内存使用由php内存管理模块所控制。若是咱们用mysqlnd来实现上面的代码,则会更加真实的反应内存使用状况:

1
2
3
Before: 232048
Limit 1: 324952
Limit 10000: 32572912

  更加糟糕的是,根据php的官方文档,mysql扩展存储查询数据使用的内存是mysqlnd的两倍,所以原来的代码使用的内存是上面显示的两倍左右。

  为了不此类问题,能够考虑分几回完成查询,减少单次查询数据量:

1
2
3
4
5
6
7
8
$totalNumberToFetch = 10000;
$portionSize = 100;
 
for ( $i = 0; $i <= ceil ( $totalNumberToFetch / $portionSize ); $i ++) {
    $limitFrom = $portionSize * $i ;
    $res = $connection ->query(
                          "SELECT `x`,`y` FROM `test` LIMIT $limitFrom, $portionSize" );
}

  联系上面提到的错误4能够看出,在实际的编码过程当中,要作到一种平衡,才能既知足功能要求,又能保证性能。

 错误6:忽略Unicode/UTF-8问题

  php编程中,在处理非ascii字符时,会遇到一些问题,要很当心的去对待,要否则就会错误遍地。举个简单的例子,strlen($name),若是$name包含非ascii字符,那结果就有些出乎意料。在此给出一些建议,尽可能避免此类问题:

  • 若是你对unicode和utf-8不是很了解,那么你至少应该了解一些基础。推荐阅读这篇文章
  • 最好使用mb_*函数来处理字符串,避免使用老的字符串处理函数。这里要确保PHP的“multibyte”扩展已开启。
  • 数据库和表最好使用unicode编码。
  • 知道jason_code()函数会转换非ascii字符,但serialize()函数不会。
  • php代码源文件最好使用不含bom的utf-8格式。

  在此推荐一篇文章,更详细的介绍了此类问题: UTF-8 Primer for PHP and MySQL

 错误7:假定$_POST老是包含POST数据

  PHP中的$_POST并不是老是包含表单POST提交过来的数据。假设咱们经过 jQuery.ajax() 方法向服务器发送了POST请求:

1
2
3
4
5
6
7
// js
$.ajax({
    url: 'http://my.site/some/path' ,
    method: 'post' ,
    data: JSON.stringify({a: 'a' , b: 'b' }),
    contentType: 'application/json'
});

  注意代码中的 contentType: ‘application/json’ ,咱们是以json数据格式来发送的数据。在服务端,咱们仅输出$_POST数组:

1
2
// php
var_dump( $_POST );

  你会很惊奇的发现,结果是下面所示:

1
array (0) { }

  为何是这样的结果呢?咱们的json数据 {a: ‘a’, b: ‘b’} 哪去了呢?

  答案就是PHP仅仅解析Content-Type为 application/x-www-form-urlencoded 或 multipart/form-data的Http请求。之因此这样是由于历史缘由,PHP最初实现$_POST时,最流行的就是上面两种类型。所以虽然说 如今有些类型(好比application/json)很流行,但PHP中仍是没有去实现自动处理。

 

  由于$_POST是全局变量,因此更改$_POST会全局有效。所以对于Content-Type为 application/json 的请求,咱们须要手工去解析json数据,而后修改$_POST变量。

1
2
// php
$_POST = json_decode( file_get_contents ( 'http://www.noobyard.com/tag/php://input' ), true);

  此时,咱们再去输出$_POST变量,则会获得咱们指望的输出:

1
array (2) { [ "a" ]=> string(1) "a" [ "b" ]=> string(1) "b" }

 错误8:认为PHP支持字符数据类型

  看看下面的代码,猜想下会输出什么:

1
2
3
for ( $c = 'a' ; $c <= 'z' ; $c ++) {
    echo $c . "\n" ;
}

  若是你的回答是输出’a'到’z',那么你会惊奇的发现你的回答是错误的。

  不错,上面的代码的确会输出’a'到’z',但除此以外,还会输出’aa’到’yz’。咱们来分析下为何会是这样的结果。

  在PHP中不存在char数据类型,只有string类型。明白这点,那么对’z'进行递增操做,结果则为’aa’。对于字符串比较大小,学过C的应该都知道,’aa’是小于’z'的。这也就解释了为什么会有上面的输出结果。

  若是咱们想输出’a'到’z',下面的实现是一种不错的办法:

1
2
3
for ( $i = ord( 'a' ); $i <= ord( 'z' ); $i ++) {
    echo chr ( $i ) . "\n" ;
}

  或者这样也是OK的:

1
2
3
4
5
$letters = range( 'a' , 'z' );
 
for ( $i = 0; $i < count ( $letters ); $i ++) {
    echo $letters [ $i ] . "\n" ;
}

 错误9:忽略编码标准

  虽然说忽略编码标准不会致使错误或是bug,但遵循必定的编码标准仍是很重要的。

  没有统一的编码标准会使你的项目出现不少问题。最明显的就是你的项目代码不具备一致性。更坏的地方在于,你的代码将更加难以调试、扩展和维护。这也就意味着你的团队效率会下降,包括作一些不少无心义的劳动。

  对于PHP开发者来讲,是比较幸运的。由于有PHP编码标准推荐(PSR),由下面5个部分组成:

  • PSR-0:自动加载标准
  • PSR-1:基本编码标准
  • PSR-2:编码风格指南
  • PSR-3:日志接口标准
  • PSR-4:自动加载

  PSR最初由PHP社区的几个大的团体所建立并遵循。Zend, Drupal, Symfony, Joomla及其它的平台都为此标准作过贡献并遵循这个标准。即便是PEAR,早些年也想让本身成为一个标准,但如今也加入了PSR阵营。

  在某些状况下,使用什么编码标准是可有可无的,只要你使用一种编码风格并一直坚持使用便可。可是遵循PSR标准不失为一个好办法,除非你有什么 特殊的缘由要 本身弄一套。如今愈来愈多的项目都开始使用PSR,大部分的PHP开发者也在使用PSR,所以使用PSR会让新加入你团队的成员更快的熟悉项目,写代码时 也会更加温馨。

 错误10:错误使用empty()函数

  一些PHP开发人员喜欢用empty()函数去对变量或表达式作布尔判断,但在某些状况下会让人很困惑。

  首先咱们来看看PHP中的数组Array和数组对象ArrayObject。看上去好像没什么区别,都是同样的。真的这样吗?

1
2
3
4
5
6
// PHP 5.0 or later:
$array = [];
var_dump( empty ( $array ));         // outputs bool(true)  
$array = new ArrayObject();
var_dump( empty ( $array ));         // outputs bool(false)
// why don't these both produce the same output?

  让事情变得更复杂些,看看下面的代码:

1
2
3
4
5
// Prior to PHP 5.0:
$array = [];
var_dump( empty ( $array ));         // outputs bool(false)  
$array = new ArrayObject();
var_dump( empty ( $array ));         // outputs bool(false)

  很不幸的是,上面这种方法很受欢迎。例如,在Zend Framework 2中,Zend\Db\TableGateway 在 TableGateway::select() 结果集上调用 current() 方法返回数据集时就是这么干的。开发人员很容易就会踩到这个坑。

  为了不这些问题,检查一个数组是否为空最后的办法是用 count() 函数:

1
2
3
4
5
// Note that this work in ALL versions of PHP (both pre and post 5.0):
$array = [];
var_dump( count ( $array ));         // outputs int(0)
$array = new ArrayObject();
var_dump( count ( $array ));         // outputs int(0)

  在这顺便提一下,由于PHP中会将数值0认为是布尔值false,所以 count() 函数能够直接用在 if 条件语句的条件判断中来判断数组是否为空。另外,count() 函数对于数组来讲复杂度为O(1),所以用 count() 函数是一个明智的选择。

  再来看一个用 empty() 函数很危险的例子。当在魔术方法 __get() 中结合使用 empty() 函数时,也是很危险的。咱们来定义两个类,每一个类都有一个 test 属性。

  首先咱们定义 Regular 类,有一个 test 属性:

1
2
3
4
class Regular
{
    public $test = 'value' ;
}

  而后咱们定义 Magic 类,并用 __get() 魔术方法来访问它的 test 属性:

1
2
3
4
5
6
7
8
9
10
11
class Magic
{
    private $values = [ 'test' => 'value' ];
 
    public function __get( $key )
    {
        if (isset( $this ->values[ $key ])) {
            return $this ->values[ $key ];
        }
    }
}

  好了。咱们如今来看看访问各个类的 test 属性会发生什么:

1
2
3
4
$regular = new Regular();
var_dump( $regular ->test);     // outputs string(4) "value"
$magic = new Magic();
var_dump( $magic ->test);       // outputs string(4) "value"

  到目前为止,都仍是正常的,没有让咱们感到迷糊。

  但在 test 属性上使用 empty() 函数会怎么样呢?

1
2
var_dump( empty ( $regular ->test));     // outputs bool(false)
var_dump( empty ( $magic ->test));       // outputs bool(true)

  结果是否是很意外?

  很不幸的是,若是一个类使用魔法 __get() 函数来访问类属性的值,没有简单的方法来检查属性值是否为空或是不存在。在类做用域外,你只能检查是否返回 null 值,但这并不必定意味着没有设置相应的键,由于键值能够被设置为 null 。

  相比之下,若是咱们访问 Regular 类的一个不存在的属性,则会获得一个相似下面的Notice消息:

1
2
3
4
Notice: Undefined property: Regular:: $nonExistantTest in /path/to/test.php on line 10
 
Call Stack:
    0.0012     234704   1. {main}() /path/to/test.php:0