ReachRich洞察 › 逐笔与微结构数据:大单分类与 Lee-Ready 内外盘近似

逐笔与微结构数据:大单分类与 Lee-Ready 内外盘近似

日线 + 分钟线之外,逐笔成交数据包含微观资金行为的关键信息:每一笔交易的买卖方向、单笔大小、撮合时间。本文讲 A股逐笔数据的字段、内外盘判定与典型应用。

数据结构

A股逐笔成交通常含字段: - time 撮合时间(毫秒级) - price 成交价 - volume 成交量 - side 买/卖标记(部分源缺失需算法判定) - order_no / trade_no 委托/成交编号(用于关联报单)

主动买卖判定:Lee-Ready 算法

如果数据源未直接标 side(很多 A股逐笔源 side=0),需用算法近似——Lee-Ready (1991) 是经典做法:

  1. 如果成交价 > 中间价 → 主动(外盘)
  2. 如果成交价 < 中间价 → 主动(内盘)
  3. 如果等于中间价 → 用上一笔涨跌(tick test)判定

Lee-Ready 不是 100% 准确,但作为大样本统计足够。

单笔大小分类

类别 量级(股)
散单 < 4000
中单 4000 - 20000
大单 20000 - 100000
超大单 ≥ 100000

阈值因股而异(高价股阈值更低)。主力资金流指标本质就是"大单+超大单的净流入 - 净流出"。

应用

数据口径必须一致——所有信号回测与实时应基于同一份逐笔流。详见 数据覆盖稳定与准确