代码之家  ›  专栏  ›  技术社区  ›  zildjohn01

php的substr有多高效?

  •  7
  • zildjohn01  · 技术社区  · 14 年前

    我正在用PHP编写一个解析器,它必须能够处理大内存字符串,所以这是一个有点重要的问题。(也就是说,请不要“过早优化”火焰我,请)

    如何 substr 功能工作?它是在内存中复制字符串数据的第二个副本,还是引用原始数据?例如,如果我担心打电话, $str = substr($str, 1); 在循环中?

    3 回复  |  直到 14 年前
        1
  •  3
  •   salathe    14 年前

    为了进一步说明Chad的意见,您的代码将要求两个字符串(完整字符串和完整字符串减去第一个字符)同时在内存中(尽管不是由于Chad所述的分配)。见:

    $string = str_repeat('x', 1048576);
    printf("MEM:  %d\nPEAK: %d\n", memory_get_usage(), memory_get_peak_usage());
    
    substr($string, 1);
    printf("MEM:  %d\nPEAK: %d  :-(\n", memory_get_usage(), memory_get_peak_usage());
    
    $string = substr($string, 1);
    printf("MEM:  %d\nPEAK: %d  :-(\n", memory_get_usage(), memory_get_peak_usage());
    

    输出类似(内存值以字节为单位):

    MEM:  1093256
    PEAK: 1093488
    MEM:  1093280
    PEAK: 2142116  :-(
    MEM:  1093276
    PEAK: 2142116  :-(
    
        2
  •  4
  •   soulmerge    14 年前

    如果你真的在关注效率,你需要保持一个指针-我的意思是 指数 -用你的绳子。许多字符串函数接受从其开始操作的偏移量(例如 strpos() 的第三个参数)。通常,我会建议编写一个对象来包装这个功能,但是如果您希望大量使用它,这可能会导致性能瓶颈。以下是我的意思(不带oo)的一个例子:

    while ($whatever) {
        $pos = strpos($string, $myToken, $startIndex);
        # do something using $pos
        $startIndex = $pos;
    }
    

    如果需要,可以编写自己的包装类来执行这些字符串操作,并查看它是否会影响速度:

    class _String {
        private $string;
        private $startIndex;
        private $length;
        public function __construct($string) {
            $this->string = $string;
            $this->startIndex = 0;
            $this->length = strlen($string);
        }
        public function substr($from, $length = NULL) {
            $this->startIndex = $from;
            if ($length !== NULL) {
                $this->endIndex = $from + $length;
            }
        }
        # other functions you might use
        # ...
    }
    
        3
  •  1
  •   Andrew Hare    14 年前

    是的,您应该小心地在循环中执行任何字符串操作,因为每次迭代都会生成字符串的新副本。