TheGraph 一: 架构解析

TheGraph 一: 架构解析
Photo by Shubham Dhage / Unsplash

The Graph 的整体架构图:

The Graph 与 SubGraph 交互流程的时序图:

接下来,我们结合架构图和时序图,对其中的关键节点和源码进行详细解释,并说明 subgraph 中的关键定义数据是如何串联整个流程的。

一、Subgraph Instance Manager 加载和管理 Subgraph Instance

  1. load_subgraph_manifests() 方法加载所有已部署的 subgraph 配置信息。
fn load_subgraph_manifests(&self) -> Result<Vec<SubgraphManifest>, Error> {
    // ...
    let mut manifests = vec![];
    for entry in fs::read_dir(&self.subgraph_manifest_dir)? {
        // ...
        let manifest = yaml::from_reader(file).map_err(|e| {
            format_err!("invalid subgraph manifest in {:?}: {}", path, e)
        })?;
        manifests.push(manifest);
    }
    Ok(manifests)
}

这里的 SubgraphManifest 就是 subgraph 的关键定义数据之一,它包含了 subgraph 的 schema、数据源、mapping 函数等信息。

  1. create_instance() 方法根据 SubgraphManifest 创建 SubgraphInstance
fn create_instance(
    &self,
    manifest: SubgraphManifest,
    host_metrics: Arc<HostMetrics>,
) -> Result<SubgraphInstance, Error> {
    // ...
    let required_capabilities = manifest.required_ethereum_capabilities();
    let network_name = manifest.network_name();
    let instance = SubgraphInstance::from_manifest(
        &manifest,
        self.host_builder.clone(),
        host_metrics.cheap_clone(),
        self.link_resolver.cheap_clone(),
        required_capabilities,
    )?;
    Ok(instance)
}

可以看到,SubgraphInstance 是根据 SubgraphManifest 创建的,SubgraphManifest 中定义的信息会被传递到 SubgraphInstance 中。

二、BlockIngestor 获取区块数据并分发给 SubgraphInstance

  1. process_block() 方法根据 SubgraphManifest 中定义的 DataSource,将区块数据拆分为一个或多个 TriggerData
fn process_block(&mut self, block_ptr: BlockPtr) -> Result<bool, Error> {
    // ...
    for data_source in self.ctx.manifest.data_sources.iter() {
        let data_source_name = data_source.name.as_str();
        let triggers = data_source.triggers_in_block(&block_ptr)?;
        // ...
        for trigger in triggers {
            // ...
            self.process_data_trigger(trigger, block_ptr)?;
            // ...
        }
    }
    Ok(true)
}

这里的 data_source 就是 subgraph 的另一个关键定义数据,它定义了如何从区块链上获取数据,以及如何将原始数据转换为 TriggerData

  1. process_trigger() 方法将 TriggerData 发送给对应的 SubgraphInstance
pub fn process_trigger(
    &self,
    logger: &Logger,
    manifest_id: &SubgraphDeploymentId,
    trigger: &TriggerData,
    state: BlockState,
    proof_of_indexing: SharedProofOfIndexing,
    causality_region: &str,
) -> Result<BlockState, MappingError> {
    let instance = self.instances.read().unwrap().get(manifest_id).ok_or_else(|| {
        format_err!("no instance for subgraph `{}` when processing trigger", manifest_id)
    })?;

    instance.process_trigger(logger, trigger, state, proof_of_indexing, causality_region)
}

这里的 manifest_id 就是用来标识和匹配 SubgraphInstance 的,确保 TriggerData 被发送到正确的 SubgraphInstance

三、SubgraphInstance 处理 TriggerData 并将结果写入数据库

  1. process_trigger() 方法处理 TriggerData,调用 mapping 函数生成 EntityOperation
pub fn process_trigger(
    &mut self,
    logger: &Logger,
    trigger: &TriggerData,
    mut state: BlockState,
    proof_of_indexing: SharedProofOfIndexing,
    causality_region: &str,
) -> Result<BlockState, MappingError> {
    // ...
    let trigger = Arc::new(trigger.to_asc_ptr());

    let result = self.ctx.host_exports.ethereum_call(
        logger.clone(),
        block_ptr,
        trigger,
        state.deref_mut(),
        proof_of_indexing,
        causality_region,
    );
    // ...
}

这里的 mapping 函数就是 subgraph 的第三个关键定义数据,它定义了如何将 TriggerData 转换为 EntityOperation,也就是如何将区块链数据转换为 The Graph 的数据模型。

  1. write_entity_operations() 方法将 EntityOperation 写入本地的 PostgreSQL 数据库。
fn write_entity_operations(
    &self,
    logger: &Logger,
    entity_operations: Vec<EntityOperation>,
) -> Result<(), StoreError> {
    // ...
    let entity_count = self.store.transact_block_operations(
        entity_operations,
        None,
        &self.subgraph_id,
        block_ptr,
        store_event,
    )?;
    // ...
}

这里的 entity_operations 就是 mapping 函数的输出,代表了对数据库的写入操作。store 则是 The Graph 的本地数据库组件,负责将数据持久化存储。

四、GraphQL API 提供数据查询服务

GraphQL API 会根据 subgraph 的 schema 定义生成相应的查询接口,供 Dapp 调用。当收到查询请求时,会将请求转换为相应的数据库查询,从 PostgreSQL 中获取数据并返回。

这里的 schema 定义就是 subgraph 的第四个关键定义数据,它定义了 The Graph 数据模型的结构,以及暴露给 Dapp 的 GraphQL 查询接口。

综上所述,subgraph 的四个关键定义数据:

  1. SubgraphManifest: 定义了 subgraph 的基本信息,如 schema、数据源、mapping 函数等。
  2. DataSource: 定义了如何从区块链获取数据,以及如何将原始数据转换为 TriggerData
  3. Mapping 函数: 定义了如何将 TriggerData 转换为 EntityOperation,即如何将区块链数据转换为 The Graph 的数据模型。
  4. Schema: 定义了 The Graph 数据模型的结构,以及暴露给 Dapp 的 GraphQL 查询接口。

这四个部分串联了整个 The Graph 的工作流程,从区块链数据的获取、到数据的转换和存储、再到数据的查询和服务,形成了一个完整的数据处理管道。

通过这种方式,The Graph 实现了区块链数据的高效索引和查询,为 Dapp 提供了一个方便、快捷、灵活的数据服务层。Dapp 开发者可以通过定义 subgraph,将复杂的区块链数据映射为简单的 GraphQL 模型,大大降低了开发复杂度和门槛。

同时,这种架构也具有很好的可扩展性和可维护性。新的 Dapp 可以方便地接入 The Graph 网络,只需定义自己的 subgraph 即可。而 The Graph 网络可以通过增加节点来横向扩展,支持更大的数据量和查询吞吐。

希望通过这个结合架构图和关键源码的分析,能够帮助你更全面、更深入地理解 The Graph 的工作原理,以及 subgraph 在其中扮演的重要角色。如果还有任何问题或建议,欢迎随时交流探讨。

Read more

ngrok本地调试原理及Telegram mini app cookie path 问题

ngrok本地调试原理及Telegram mini app cookie path 问题

在现代web开发中,本地调试是一个非常重要的环节。然而,当我们需要将本地开发的应用暴露到公网以便进行测试时,就会遇到一些挑战。本文将详细介绍如何使用ngrok实现内网穿透进行本地调试,特别是在Telegram小程序开发场景中的应用,以及可能遇到的常见问题及其解决方案。 ngrok原理 ngrok是一个反向代理工具,它可以将本地服务器安全地暴露到公网。下面是ngrok的工作原理: 1. 用户启动ngrok客户端,并指定要暴露的本地端口。 2. ngrok客户端与ngrok云服务建立安全的通道。 3. ngrok云服务生成一个公网可访问的URL。 4. 当外部请求到达这个URL时,ngrok云服务将请求通过安全通道转发到本地ngrok客户端。 5. 本地ngrok客户端将请求转发到指定的本地端口。 6. 本地服务器处理请求并返回响应,响应通过相同的路径返回给客户端。 Telegram小程序调试场景 在Telegram小程序开发中,我们经常需要使用ngrok来进行本地调试。以下是具体步骤: 1. 启动本地开发服务器(例如运行在localhost:3000)。

TypeScript:从架构分层设计到IOC和AOP

TypeScript:从架构分层设计到IOC和AOP

TypeScript作为JavaScript的超集,为开发者提供了强大的类型系统和面向对象编程能力。然而,要在大型项目中充分发挥TypeScript的优势,我们需要深入理解软件架构原则和设计模式。本文将探讨如何使用TypeScript构建一个健壮的应用架构,涵盖分层设计、常见设计模式、控制反转(IOC)和面向切面编程(AOP)等高级概念。 分层架构 分层架构是组织大型应用程序的常用方法。它有助于关注点分离,使得每一层都可以独立开发和测试。一个典型的分层架构包括: 1. 表现层(Presentation Layer) 2. 业务逻辑层(Business Logic Layer) 3. 数据访问层(Data Access Layer) 4. 数据库(Database) 让我们使用图表来可视化这个架构: 接下来,我们将探讨每一层中可能使用的设计模式,并通过TypeScript代码示例来说明如何实现这些模式。 表现层 表现层负责处理用户界面和用户交互。在这一层,我们经常使用MVC(Model-View-Controller)或MVVM(Model-View-ViewM

Jotai v2: React状态管理的新篇章

Jotai v2: React状态管理的新篇章

Jotai是一个为React应用设计的轻量级状态管理库。2023年3月,Jotai发布了v2.0版本,带来了许多新特性和改进。本文将深入探讨Jotai v2的使用方法、适用场景、设计理念、源码结构以及核心功能的实现原理。 版本信息 本文讨论的是Jotai v2.0.3版本,发布于2023年5月。你可以通过以下命令安装 npm install [email protected] 基本使用 Jotai的核心概念是"atom"。atom是最小的状态单位,可以存储任何JavaScript值。让我们看一个简单的例子: import { atom, useAtom } from 'jotai' // 创建一个atom const countAtom = atom(0) function Counter() { // 使用atom const [count, setCount] = useAtom(

加密货币交易所十二:安全性和风险控制

加密货币交易所十二:安全性和风险控制

在加密货币合约交易所中,安全性和风险控制是至关重要的。这不仅关系到交易所的声誉和用户的资产安全,也直接影响到整个加密货币生态系统的稳定性。本章将详细探讨合约交易所在安全性和风险控制方面的关键策略和实施方法。 多重签名机制 多重签名(MultiSig)是一种强大的安全机制,要求多个私钥来授权交易,大大降低了单点故障和内部欺诈的风险。 概念解释 多重签名是一种需要多个私钥来签署和授权交易的加密技术。例如,在一个 2-of-3 多重签名设置中,需要三个私钥中的任意两个来完成交易。 在合约交易所中的应用 热钱包管理: * 设置:通常采用 2-of-3 或 3-of-5 的多重签名方案。 * 应用:每次从热钱包转出大额资金时,需要多个管理员的授权。 冷钱包管理: * 设置:可能采用更严格的 3-of-5 或 4-of-7 方案。 * 应用:定期将热钱包中的多余资金转移到冷钱包时使用。 智能合约升级: * 设置:可能需要多个核心开发者和安全审计员的签名。 * 应用:在升级关键智能合约时,确保变更经过充分审核和授权。 实现考虑 密钥管理: * 使用硬件安全