欢迎各位兄弟 发布技术文章

这里的技术是共享的

You are here

深入 Composer autoload

这几天看到 phphub 上面有人开始进坑怒看 laravel 源代码,于是我也凑个热闹来看下这个故事。

众所周知 composer 是现代 PHP 项目的基石, 与古老的 pear 不同, composer 并不是一款专注于系统级别 php 管理的包管理系统,而是基于项目的一个库管理系统。这就好比 npm install -g 和 npm install 的区别。而且最主要的是 pear 不太能跟上时代的潮流,在大家都在用 psr-* 的时候 pear 依然我行我素自成一体。

好吧,可能这是好事,但是也是坏事。好事是很多优秀的包都从 pear 发家致富,比如 PHP_CodeSnifferPHP_Unit 等等。但是随着时代的发展,php社区也渐渐地从其他社区汲取到了一些精华,慢慢地向前发展。最近的 laravel 就是直接扔进了 composer。因为 psr-4 这个规范真是不能再爽更多。这真的是我用各种包用得最顺手的一套命名规范了。

扯远了,扯回 vendor/composer/autoload_real.php 这个核心 composer 文件。

自动加载的类型#

总体来说 composer 提供了几种自动加载类型

  1. classmap

  2. psr-0

  3. psr-4

  4. files

这几种自动加载都会用到,理论上来说,项目代码用 psr-4 自动加载, helper 用 files 自动加载,development 相关用 classmap 自动加载。 psr-0 已经被抛弃了,不过有些历史遗留依然在用,所以偶尔也会看到。

classmap#

这应该是最最简单的 autoload 模式了。大概的意思就是这样的:

{
  "classmap": ["src/"]
}

然后 composer 在背后就会读取这个文件夹中所有的文件 然后再 vendor/composer/autoload_classmap.php 中怒将所有的 class 的 namespace + classname 生成成一个 key => value 的 php 数组

<?php
return [ 
  'App\\Console\\Kernel' => $baseDir . '/app/Console/Kernel.php'
];
?>

然后就可以光明正大地用 spl_autoload_register 这个函数来怒做自动加载了。

好吧 上面的例子其实有点 tricky 就是上面这个 autoload 实际上是根据 prs-4 来生成出来的。不过这不重要,了解底层重要点,我们可以看到所有的所谓的 autoloading 其实可以理解为生成了这么一个 classmap,这是 composer dump-autoload -o 做的事儿。不然的话compoesr 会吭哧吭哧地去动态读取 psr-4 和 prs-0 的内容。

psr-0#

现在这个标准已经过时了。当初制定这个标准的时候主要是在 php 从 5.2 刚刚跃迁到 5.3+ 有了命名空间的概念。所以这个时候 psr-0 的标准主要考虑到了 <5.2 的 php 中 类似 Acme_Util_ClassName 这样的写法。

{
  "name": "acme/util",
  "auto" : {
    "psr-0": {
      "Acme\\Util\\": "src/"
    }
  }
}

文档结构是这样的

vendor/
  acme/
    util/
      composer.json
      src/
        Acme/
          Util/
            ClassName.php

ClassName.php 中是这样的

<?php
class Acme_Util_ClassName{}
?>

我们可以看到由于旧版本的 php 没有 namespace 所以必须通过 _ 将类区分开。

这样稍微有点麻烦。指向一个文件夹之后 src 还要在 src 中分成好几层文档树。这样太深了。没有办法,但是似乎想要兼容 _ 的写法仔细想想这是唯一的办法了。(psr-0 要求 autoloading 的时候将 类中的 _ 转义为 '\')

所以在 php5.2 版本已经彻底被抛弃的今天, FIG 就怒推出了 psr-4

psr-4#

这个标准出来的时候一片喷声,大概的意思就是 FIG 都是傻逼么,刚刚出了 psr-0 然后紧跟着进推翻了自己。不过 FIG 也有自己的苦衷,帮没有 namespace 支持的 php5.2 擦了那么久的屁股,在2014年10月21日的早晨,终于丢失了睡眠。

抛弃了 psr-0 的 composer 从此变得非常清爽。

最简单来讲就是可以把 prs-4 的 namespace 直接想想成 file structure

{
  "name": "acme/util",
  "auto" : {
    "psr-4": {
      "Acme\\Util\\": "src/"
    }
  }
}
vendor/
  acme/
    util/
      composer.json
      src/
        ClassName.php

可以看到将 Acme\Util 指向了 src 之后 psr-4 就会默认所有的 src 下面的 class 都已经有了 Acme\Util的 基本 namespace,而 psr-4 中不会将 _ 转义成 \ 所以就没有必要有 psr-0 那么深得文档结构了。

<?php
namespace Acme\Util;
class ClassName {}
?>

file#

然而这还是不够。因为可能会有一些全局的 helper function 的存在。

这个写法很简单就不多看了。

{
  "files": [
    "path/to/file.php"
  ]
}

autoload_real.php#

好了看了所有的 autoload 类型那么直接怒看一发实现。

首先映入眼帘的就是一坨,我的是这样的

ComposerAutoloaderInit64c47026c93126586e44d036738c0862

为啥?

因为这个类是全局的啊少年。

作为模块化大行其道的今天,全局的类总是有那么点奇怪。为了不让这个 autoload 的 helper 污染全局,composer 的仁兄们还是绞尽脑汁怒弄了这么一个奇怪的 hash。这直接就逼迫广大二笔程序员们不要跟这个撞衫。

好吧,接着往下看。

主要只有这么一个方法 getLoader

<?php
// autoload_real.php @generated by Composer

class ComposerAutoloaderInit64c47026c93126586e44d036738c0862
{
    private static $loader;

    public static function loadClassLoader($class)
    {
        if ('Composer\Autoload\ClassLoader' === $class) {
            require __DIR__ . '/ClassLoader.php';
        }
    }

    public static function getLoader()
    {
        if (null !== self::$loader) {
            return self::$loader;
        }

        spl_autoload_register(array('ComposerAutoloaderInit64c47026c93126586e44d036738c0862', 'loadClassLoader'), true, true);
        self::$loader = $loader = new \Composer\Autoload\ClassLoader();
        spl_autoload_unregister(array('ComposerAutoloaderInit64c47026c93126586e44d036738c0862', 'loadClassLoader'));

        $map = require __DIR__ . '/autoload_namespaces.php';
        foreach ($map as $namespace => $path) {
            $loader->set($namespace, $path);
        }

        $map = require __DIR__ . '/autoload_psr4.php';
        foreach ($map as $namespace => $path) {
            $loader->setPsr4($namespace, $path);
        }

        $classMap = require __DIR__ . '/autoload_classmap.php';
        if ($classMap) {
            $loader->addClassMap($classMap);
        }

        $loader->register(true);

        $includeFiles = require __DIR__ . '/autoload_files.php';
        foreach ($includeFiles as $file) {
            composerRequire64c47026c93126586e44d036738c0862($file);
        }

        return $loader;
    }
}

function composerRequire64c47026c93126586e44d036738c0862($file)
{
    require $file;
}

?>

在讲什么?其实很简单。

  1. 找 Composer\ClassLoader 如果不存在就是生成一个实例放在 ComposerAutoloaderInit64c47026c93126586e44d036738c0862 中

  2. 然后将 composer cli 生成的各种 autoload_psr4autoload_classmapautoload_namespaces(psr-0) 全都注册到 Composer\ClassLoader 中。

  3. 直接 require 所有在 autoload_files 中的文件

其中 composerRequire64c47026c93126586e44d036738c0862 要解释下。 为什么这个不直接用 require 而是定义在了类的外边?

调查 Composer\ClassLoader 发现了这么一个注释

Scope isolated include. Prevents access to $this/self from included files.

好吧还是怕二笔程序员犯浑。想想一下,如果有人在 autoload_files 中的文件中写了 $this 或者 self 那就屎了。所以当require 一个file的时候我们希望解释器能够成功报错。

不容易,终于快要胜利了。

为什么总是要 composer dump-autoload ?#

刚开始接触用 composer 的时候一直被这个问题蛊惑。很不理解为什么总是要打这句命令才能不报错,现在终于知道根结了。

因为 database 文件夹使用 classmap 来做加载的。所以只有在打了 composer dumpautoload 之后 composer 才会更新 autoload_classmap 的内容。

怎样可以避免一直打 composer dump-autoload ?#

可以怒用 psr-4 注册一个文件夹这样增减文件就不用再管了。Composer\ClassLoader 会自动检查 composer.json 中注册的 psr-4 入口然后根据 psr-4 去自动查找文件。

生产环境为什么要 composer dump-atoload -o ?#

因为 psr-4 自动加载会再背后跑一些逻辑。具体可以调查 Composer\ClassLoader 去看。

<?php
private function findFileWithExtension($class, $ext)
{
    // PSR-4 lookup
    $logicalPathPsr4 = strtr($class, '\\', DIRECTORY_SEPARATOR) . $ext;

    $first = $class[0];
    if (isset($this->prefixLengthsPsr4[$first])) {
        foreach ($this->prefixLengthsPsr4[$first] as $prefix => $length) {
            if (0 === strpos($class, $prefix)) {
                foreach ($this->prefixDirsPsr4[$prefix] as $dir) {
                    if (is_file($file = $dir . DIRECTORY_SEPARATOR . substr($logicalPathPsr4, $length))) {
                        return $file;
                    }
                }
            }
        }
    }

    // PSR-4 fallback dirs
    foreach ($this->fallbackDirsPsr4 as $dir) {
        if (is_file($file = $dir . DIRECTORY_SEPARATOR . $logicalPathPsr4)) {
            return $file;
        }
    }

    // PSR-0 lookup
    if (false !== $pos = strrpos($class, '\\')) {
        // namespaced class name
        $logicalPathPsr0 = substr($logicalPathPsr4, 0, $pos + 1)
            . strtr(substr($logicalPathPsr4, $pos + 1), '_', DIRECTORY_SEPARATOR);
    } else {
        // PEAR-like class name
        $logicalPathPsr0 = strtr($class, '_', DIRECTORY_SEPARATOR) . $ext;
    }

    if (isset($this->prefixesPsr0[$first])) {
        foreach ($this->prefixesPsr0[$first] as $prefix => $dirs) {
            if (0 === strpos($class, $prefix)) {
                foreach ($dirs as $dir) {
                    if (is_file($file = $dir . DIRECTORY_SEPARATOR . $logicalPathPsr0)) {
                        return $file;
                    }
                }
            }
        }
    }

    // PSR-0 fallback dirs
    foreach ($this->fallbackDirsPsr0 as $dir) {
        if (is_file($file = $dir . DIRECTORY_SEPARATOR . $logicalPathPsr0)) {
            return $file;
        }
    }

    // PSR-0 include paths.
    if ($this->useIncludePath && $file = stream_resolve_include_path($logicalPathPsr0)) {
        return $file;
    }
}
?>

可以看到 psr-4 或者 psr-0 的自动加载都是一件很累人的事儿。基本是个 O(n2) 的复杂度。另外有一大堆 is_file 之类的 IO 操作所以性能堪忧。

所以给出的解决方案就是空间换时间。

Compsoer\ClassLoader 会优先查看 autoload_classmap 中所有生成的注册类。如果在classmap 中没有发现再 fallback 到 psr-4 然后 psr-0

所以当打了 composer dump-autoload -o 之后,composer 就会提前加载需要的类并提前返回。这样大大减少了 IO 和深层次的 loop。

最后推荐大家来踩踩我的小博客,都是些笔记类的,望各路大牛来指正。

瀚爷的小窝

 本帖已被设为精华帖!
   
回复数量: 17
  • lucifergit
    lucifergit
     ⋅ 2年前

    涨姿势了:relaxed:

  • vicvinc
    vicvinc 
     ⋅ 2年前

    怒马再看

  • Mombuyish
    Mombuyish
     ⋅ 2年前

    相當厲害的tracing 淺顯易懂

  • qloog
     ⋅ 2年前

    怒赞~ 说的挺清晰的

  • 立Q
    立Q
     ⋅ 2年前

    就喜欢这样往深里走的文章,赞啊!~

  • lijinma 就喜欢折腾。
     ⋅ 2年前

    怒赞一个。

  • joy696163
    joy696163
     ⋅ 2年前

    写的不错

  • troubleman
    troubleman
     ⋅ 2年前

    博客的风格很喜欢,已入手:wink:

  • joy696163
    joy696163
     ⋅ 2年前

    "好吧还是怕二笔程序员犯浑。想想一下,如果有人在 autoload_files 中的文件中写了 $this 或者 self 那就屎了。所以当require 一个file的时候我们希望解释器能够成功报错。" 不是太理解这句话, 如果有人在 autoload_files 中的文件中写了 $this 或者 self 会怎样呢?

  • hanslee
    hanslee
     ⋅ 2年前

    @joy696163 做下试验就好了。

    仔细想一下,因为 authoload_file.php 中的所有的函数或者类都应该是生存在全局里面的,所以如果写了 $this 或者 self 那么正确地报错应该是告诉用户你不在 类 的 scope 里面所以拿不到 $this 或者 self 这两个指针。而不是应该告诉用户我找不到当前类里面的方法

  1. composer.json 里面加入 files: ['app/helpers.php']

  2. compsoer dump-autoload

  3. 在 app/helpers.php 里面加入

    <?php
    var_dump(self::getWhatEver('foo'));

  4. php artisian 这时候应该报错

    PHP Fatal error:  Cannot access self:: when no class scope is active in Path/To/My/app/helpers.php on line 2
    Fatal error: Cannot access self:: when no class scope is active in Path/To/My/app/helpers.php on line 2

  5. 将 vendor/composer/autoload_real.php 中第45行改成 require($file)

  6. php artisian 这时候就不是 no class scope 了。而是打印出来了

    PHP Fatal error:  Call to undefined method ComposerAutoloaderInit64c47026c93126586e44d036738c0862::getWathEver()
    Fatal error: Call to undefined method ComposerAutoloaderInit64c47026c93126586e44d036738c0862::getWathEver()

  • joy696163
    joy696163
     ⋅ 2年前

    @hanslee 感谢! 原来是为了给出不同的错误提示呀 :smile:

  • MrJing MOD
     ⋅ 2年前

    :thumbsup: 赞一个

  • nikaaaa
    nikaaaa
     ⋅ 2年前

    为什么你的composer文件用的auto,而不是autoload

  • hanslee
    hanslee
     ⋅ 2年前

    @nikaaaa 手残。。。对不住。。。

  • mythsumm
    mythsumm
     ⋅ 1年前

    赞一个。

  • xiejianwen
     ⋅ 8个月前

    为什么现在不能收藏文章了

  • zhangwei900808 我来自一个古老的星球,1609年来到地球,在地球上居住了将近400年(这可是...
     ⋅ 2个月前

    已收藏

  •  
    • 请注意单词拼写,以及中英文排版,参考此页

    • 支持 Markdown 格式, **粗体**、~~删除线~~、`单行代码`, 更多语法请见这里 Markdown 语法

    • 支持表情,使用方法请见 Emoji 自动补全来咯,可用的 Emoji 请见 :metal: :point_right: Emoji 列表 :star: :sparkles:

    • 上传图片, 支持拖拽和剪切板 剪贴板黏贴上传, 格式限制 - jpg, png, gif

    • 发布框支持本地存储功能,会在内容变更时保存,「提交」按钮点击时清空


    普通分类: