C++中的Thunk技术 / 非静态类成员函数作为回调函数 的实现方法
用我的理解通俗地解释一下什么是C++中的Thunk技术吧!
Thunk技术就是申请一段可执行的内存, 并通过手动构造CPU指令的形式来生成一个小巧的, 具有明确作用的代码块.
小巧? 具有明确作用? 你曾经初学C++时, 如果我没猜错的话, 肯定尝试过用C++封装一个窗口类(因为我也尝试过 :-) ), 在封装窗口类的时候,在类内部定义一个私有(或公有)的成员函数来作为窗口回调函数, 并以 CreateWindowEx(...,&MyWindowClass::WindowProc,...) 的形式构造一个窗口, 可哪知, 这完全是行不通的, 因为(非静态)类成员函数的指针可不是简单的全局成员函数指针那样!
于是, 你不得不把窗口过程定义为全局函数. 但是这样的话, 每个类都共享一个窗口过程了, 这显然不行! 于是,你可能又想到了一种算是解决办法的办法, 使用CreateWindowEx的最后一个参数LPARAM来传递this指针! 关于窗口类的封装, 这里我不再多说, 因为我打算再写一篇文章介绍用多种方法来实现窗口类的封装, 当然, 这里将要讨论的Thunk技术算是最完美的一种了! 但是,Thunk技术也不只是用于封装窗口类, 也可以用来封装线程类, etc.
传言这种技术来自于ATL/WTL, 我不会ATL/WTL, Thunk技术是我在网上学来的. MFC不是使用我接下来要介绍的通用(非完全)Thunk方式, 关于MFC的封装方式, 我将在另一篇文章里面提及(如果没忘了的话).
这里有一篇介绍通过Thunk技术的文档:Generic Thunk with 5 combinations of Calling Conventions
好吧, 言归正传, 谈谈Thunk的原理与实现...
要理解Thunk的实现, 需要清楚C/C++中的函数调用约定, 如果有不懂的, 可以参考:C/C++/动态链接库DLL中函数的调用约定与名称修饰
C++的成员函数(不讨论继承)在调用时和普通的函数并没有太大的区别, 唯一很重要的是, 需要在调用每个非静态成员函数时悄悄地传入this指针. 在类内部调用时的直接调用, 或在类外部调用时通过obj->MemberFunction的形式调用时, 编译器都在生成代码的时候帮我们传入了this指针, 所以我们能正确访问类内部的数据。但是, 像Windows的窗口回调函数WindowProc, 线程的回调函数ThreadProc, SQLite3的回调函数sqlite3_callback在被传给主调函数时,它们是不能被直接使用的, 因为主调函数不属于类的成员函数, 他们也没有this指针!
看看下面的代码:
A a1,a2; a1.foo(1,2,3); a2.foo(4,5,6);
这是我们的书写方式, 编译器在编译时将生成如下调用(只考虑__cdecl和__stdcall,没有哪一个全局函数需要__thiscall的回调):
foo(&a1,1,2,3); foo(&a2,4,5,6);
我在《C/C++/动态链接库DLL中函数的调用约定与名称修饰》中已经讨论过这个东西了...
好了, 现在我们知道foo函数的原型可以是如下的形式:
int __cdecl foo(int a,int b,int c);
假如我们有一个全局的函数, 她的原型是这样的:
int func( int (__cdecl*)(int,int,int) );
你会怎样把A类里面的foo作为回调, 传递给func? func(&A::foo); ? 这是不可行的, 我们需要借助Thunk!
1. 下面将拿Windows中的WindowProc窗口回调函数来作具体讲解__stdcall的回调函数Thunk应用
Windows的窗口管理在调用我们提供的全局窗口过程时, 此时的堆栈形式如下:
低 高 ---------------------------------------------------------- 返回地址 hWnd uMsg wParam lParam
如果我们将WindowProc定义为类成员的形式, 并在类内调用她, 则参数栈应该是如下形式(__cdecl,__stdcall):
低 高
------------------------------------------------------------------
返回地址 this hWnd uMsg wParam lParam
好了, 现在我们就可以动动手脚, 修改一下堆栈, 传入this指针, 然后就可以交给我们的成员WindowProc函数来处理啦~
因为是 WindowProc 是 __stdcall 调用约定, 就算我们多压入了一个this参数, 也不管调用者的事, 因为堆栈是由被调用者(windowProc)来清理的. 虽然只有4个显式参数, 但作为成员函数的WindowProc在结束的时候是用ret 14h返回的, this被自动清除, 你知道为什么吗?
我们只需构造如下的3条简单的指令即可:
; machine code assembly code comment ; ------------------------------------------------------------------------------------------ FF 34 24 push dword ptr[esp] ;再次压入返回地址 C7 44 24 04 ?? ?? ?? ?? mov dword ptr[esp+4],this ;修改前面那个返回地址为this指针 E9 ?? ?? ?? ?? jmp (relative target) ;转到成员函数
你没有看错, 真的就只需要这么几条简单的指令,16个字节,用纯C++却是无法实现的,是不是突然觉得汇编特别强大?~~~~ :-)
2.下面再看一个__cdecl的回调函数的Thunk技术的实现
__cdecl形式的回调函数的特点:
- 参数个数比函数声明要多一个this
- 参数栈由调用者清理
我们需要以同样的方式压入this指针, 但是__cdecl约定是由调用者来清理参数栈, 我们多传了一个this指针进去, 如果直接返回,势必会导致堆栈指针ESP错误, 所以, this指针必须由我们的程序来清除, 返回时保持被调用前一样就行了.
作为一个完整的函数, 我们不可能在函数的最后插入一条"add esp,4"来解决问题, 这办不到. __cdecl的Thunk的实现, 我在网上也没找到答案, 由于我汇编也不咋样, 所以搞了较长一段时间才把她搞出来~ 也算一劳永逸了.
我的处理办法(较__stdcall复杂, 但也只有几条指令而已):
- 弹出并保存原来的返回地址
- 压入this指针
- 压入我的返回地址
- 转到成员函数执行
- 清理this参数栈
- 跳转到原返回地址
汇编机器指令的实现(我并不擅长汇编, 你应该觉得还可以再优化一下):
; machine code assembly code comment ; ------------------------------------------------------------------------------------------ 3E 8F 05 ?? ?? ?? ?? pop dword ptr ds:[?? ?? ?? ??] ;弹出并保存返回地址(我的变量) 68 ?? ?? ?? ?? push this ;压入this指针 68 ?? ?? ?? ?? push my_ret ;压入我的返回地址 9E ?? ?? ?? ?? jmp (relative target) ;跳转到成员函数 83 C4 04 add esp,4 ;清除this栈 3E FF 25 ?? ?? ?? ?? jmp dword ptr ds:[?? ?? ?? ??] ;转到原返回地址
3. 下面贴出我写的完整代码
//Thunk.h
//ts=sts=sw=4
//女孩不哭 2013-09-11 22:00
//保留所有权利
#ifndef __THUNK_H__
#define __THUNK_H__
class AThunk
{
public:
AThunk();
~AThunk();
public:
template<typename T>
void* Stdcall(void* pThis,T mfn)
{
return fnStdcall(pThis,getmfn(mfn));
}
template<typename T>
void* Cdeclcall(void* pThis,T mfn)
{
return fnCdeclcall(pThis,getmfn(mfn));
}
private:
typedef unsigned char byte1;
typedef unsigned short byte2;
typedef unsigned int byte4;
void* fnStdcall(void* pThis,void* mfn);
void* fnCdeclcall(void* pThis,void* mfn);
template<typename T>
void* getmfn(T t)
{
union{
T t;
void* p;
}u;
u.t = t;
return u.p;
}
private:
#pragma pack(push,1)
struct MCODE_STDCALL{
byte1 push[3];
byte4 mov;
byte4 pthis;
byte1 jmp;
byte4 addr;
};
struct MCODE_CDECL{
byte1 pop_ret[7];
byte1 push_this[5];
byte1 push_my_ret[5];
byte1 jmp_mfn[5];
byte1 add_esp[3];
byte1 jmp_ret[7];
byte4 ret_addr;
};
#pragma pack(pop)
private:
MCODE_CDECL m_cdecl;
MCODE_STDCALL m_stdcall;
AThunk* m_pthis;
};
#endif//!__THUNK_H__
//Thunk.cpp
//ts=sts=sw=4
//女孩不哭 2013-09-11 22:00
//保留所有权利
#include <Windows.h>
#include "Thunk.h"
AThunk::AThunk()
{
m_pthis = (AThunk*)VirtualAlloc(NULL,sizeof(*this),MEM_COMMIT,PAGE_EXECUTE_READWRITE);
}
AThunk::~AThunk()
{
if(m_pthis){
VirtualFree(m_pthis,0,MEM_RELEASE);
}
}
void* AThunk::fnStdcall(void* pThis,void* mfn)
{
/****************************************************************************************
machine code assembly code comment
------------------------------------------------------------------------------------------
FF 34 24 push dword ptr[esp] ;再次压入返回地址
C7 44 24 04 ?? ?? ?? ?? mov dword ptr[esp+4],this ;传入this指针
E9 ?? ?? ?? ?? jmp (relative target) ;转到成员函数
****************************************************************************************/
m_pthis->m_stdcall.push[0] = 0xFF;
m_pthis->m_stdcall.push[1] = 0x34;
m_pthis->m_stdcall.push[2] = 0x24;
m_pthis->m_stdcall.mov = 0x042444C7;
m_pthis->m_stdcall.pthis = (byte4)pThis;
m_pthis->m_stdcall.jmp = 0xE9;
m_pthis->m_stdcall.addr = (byte4)mfn-((byte4)&m_pthis->m_stdcall.jmp + 5);
FlushInstructionCache(GetCurrentProcess(),&m_pthis->m_stdcall,sizeof(m_pthis->m_stdcall));
return &m_pthis->m_stdcall;
}
void* AThunk::fnCdeclcall(void* pThis,void* mfn)
{
/****************************************************************************************
machine code assembly code comment
------------------------------------------------------------------------------------------
3E 8F 05 ?? ?? ?? ?? pop dword ptr ds:[?? ?? ?? ??] ;弹出并保存返回地址
?? ?? ?? ?? push this ;压入this指针
?? ?? ?? ?? push my_ret ;压入我的返回地址
9E ?? ?? ?? ?? jmp (relative target) ;跳转到成员函数
C4 04 add esp,4 ;清除this栈
3E FF 25 ?? ?? ?? ?? jmp dword ptr ds:[?? ?? ?? ??] ;转到原返回地址
****************************************************************************************/
m_pthis->m_cdecl.pop_ret[0] = 0x3E;
m_pthis->m_cdecl.pop_ret[1] = 0x8F;
m_pthis->m_cdecl.pop_ret[2] = 0x05;
*(byte4*)&m_pthis->m_cdecl.pop_ret[3] = (byte4)&m_pthis->m_cdecl.ret_addr;
m_pthis->m_cdecl.push_this[0] = 0x68;
*(byte4*)&m_pthis->m_cdecl.push_this[1] = (byte4)pThis;
m_pthis->m_cdecl.push_my_ret[0] = 0x68;
*(byte4*)&m_pthis->m_cdecl.push_my_ret[1] = (byte4)&m_pthis->m_cdecl.add_esp[0];
m_pthis->m_cdecl.jmp_mfn[0] = 0xE9;
*(byte4*)&m_pthis->m_cdecl.jmp_mfn[1] = (byte4)mfn-((byte4)&m_pthis->m_cdecl.jmp_mfn+5);
m_pthis->m_cdecl.add_esp[0] = 0x83;
m_pthis->m_cdecl.add_esp[1] = 0xC4;
m_pthis->m_cdecl.add_esp[2] = 0x04;
m_pthis->m_cdecl.jmp_ret[0] = 0x3E;
m_pthis->m_cdecl.jmp_ret[1] = 0xFF;
m_pthis->m_cdecl.jmp_ret[2] = 0x25;
*(byte4*)&m_pthis->m_cdecl.jmp_ret[3] = (byte4)&m_pthis->m_cdecl.ret_addr;
FlushInstructionCache(GetCurrentProcess(),&m_pthis->m_cdecl,sizeof(m_pthis->m_cdecl));
return &m_pthis->m_cdecl;
}
4. 下面再贴出一篇使用示例程序, 我已经列出了我见过的常见的回调函数的使用形式
//main.cpp
#include <iostream>
#include <Windows.h>
#include <process.h>
#include "Thunk.h"
#include "resource.h"
using namespace std;
/////////////////////////////////////////////////////////
//第一个:__cdecl 回调类型
/////////////////////////////////////////////////////////
typedef int (__cdecl* CB)(int n);
void output(CB cb)
{
for(int i=0; i>3; i++){
cb(i);
}
}
class ACDCEL
{
public:
ACDCEL()
{
void* pthunk = m_Thunk.Cdeclcall(this,&ACDCEL::callback);
::output(CB(pthunk));
}
private:
int __cdecl callback(int n)
{
cout<<"n:"<<n<<endl;
return n;
}
private:
AThunk m_Thunk;
};
/////////////////////////////////////////////////////////
//第二个:__stdcall 回调类型:封装窗口类
/////////////////////////////////////////////////////////
class ASTDCALL
{
public:
ASTDCALL()
{
void* pthunk = m_Thunk.Stdcall(this,&ASTDCALL::DialogProc);
DialogBoxParam(GetModuleHandle(NULL),MAKEINTRESOURCE(IDD_DIALOG1),NULL,(DLGPROC)pthunk,0);
}
private:
INT_PTR CALLBACK DialogProc(HWND hWnd,UINT uMsg,WPARAM wParam,LPARAM lParam)
{
switch(uMsg)
{
case WM_CLOSE:
EndDialog(hWnd,0);
return 0;
}
return 0;
}
private:
AThunk m_Thunk;
};
/////////////////////////////////////////////////////////
//第三个:__stdcall 回调类型:内部线程
/////////////////////////////////////////////////////////
class AThread
{
public:
AThread()
{
void* pthunk = m_Thunk.Stdcall(this,&AThread::ThreadProc);
HANDLE handle = (HANDLE)_beginthreadex(NULL,0,(unsigned int (__stdcall*)(void*))pthunk,(void*)5,0,NULL);
WaitForSingleObject(handle,INFINITE);
CloseHandle(handle);
}
private:
unsigned int __stdcall ThreadProc(void* pv)
{
int i = (int)pv;
while(i--){
cout<<"i="<<i<<endl;
}
return 0;
}
private:
AThunk m_Thunk;
};
int main(void)
{
ASTDCALL as;
ACDCEL ac;
cout<<endl;
AThread at;
return 0;
}
5. 相关源代码下载
全部源代码及测试(VC6.0):thunk.7z