手勢輸入模式下手勢識別的原理

手勢是指人的雙手在人的意識控制下所做出的各種動作，如手指彎曲、伸展和手部在空間的運動，可以是

接收日期:2000年5月-65438+5月

基金項目:產業基金項目(96311)

作者簡介:曾芬芳(1940-)，女，湖南益陽人，華東船舶工業學院教授。

執行任務也可以是與人交流，表達某種意思或意圖。基於手勢識別的三維交互輸入技術通常

使用基於數據手套和視覺(如攝像頭)的手勢識別。

人類的手有20多個關節，手勢非常復雜。在虛擬現實的交互過程中，需要分析手勢的形成過程

確定其含義。例如，用戶可以以自然的方式抓取環境中的對象，同時，他們也可以對用戶產生相關的感知反饋，例如那些具有

有力反饋的手套可以讓人感覺到被抓物體的重量，有觸覺反饋的手套可以感覺到使用者觸摸的物體。

質地，比如毯子有多粗糙。所以，計算機要識別人類手部運動的靈活復雜的手勢是很難很難的。

非常有意義的任務。

手勢的分類早在20世紀40年代，心理學家Quek [7]就提出來了。Pavlovic [8]等人從人機界面的角度研究手勢。

按其功能分為:

手部運動

無意識的手部動作

有意識的手部動作(手勢

交流手勢

表格操作

符號(手語)

引用手語(如表示數字)。

模態手勢

執行任務的手勢(如抓錘)不僅是由骨骼肌驅動的，也是由人的信念和意識驅動的，這涉及到人的思維活動的高級行為。

人機交互的研究目的之壹就是讓機器更方便人類用戶。從用戶手勢到系統“感知”手勢的過程[9]如下

如圖1所示。

圖1系統對手勢的“感知”

圖1系統感知手勢的過程

手的動作就是手勢的表達。用戶操作

意圖是用戶想要完成的任務的內容，也就是用戶的心理工作。

移動(概念手勢)G、運動控制(變換)後，使用手勢。

鍛煉h表達。通過感覺裝置(轉換Thi)

運動H轉化為系統的輸入信息I，所以從G到I。

的映射過程是:

Tgh: G → H，即H > Tgh ( G)

Thi: H → I，即I > Thi ( H)

Tgi: G → I，即I > Thi(Tgh(G))& gt；Tgi(克)

其中Tgh是人體運動控制的傳遞函數；這是輸入設備傳遞函數。

手勢識別的任務是從系統輸入I中推斷並確定用戶的意圖G，這顯然是上述映射的逆過程。也就是

G = T- 1

文書主任(壹)(1)

H = T- 1

嗨(壹) (二)

G = T- 1

天然氣水合物(水合物)(3)

其中T- 1

地理標誌，T- 1

妳好，T- 1

Gh是Tgi，Thi，Tgh的逆變換。

所以手勢識別可以采用H = T- 1。

Hi (I)當輸入信息I時，得到手的運動h，然後由G = T- 1。

gh (H)手勢表

來推斷用戶手勢的概念意圖，或者直接從G = T- 1。

Gi (I)找到概念手勢g。

手勢識別分為靜態手勢識別和動態手勢識別。目前大部分的研究都是在線靜態手勢識別，比如Lee的研究。

是靜態孤立手勢[10]。動態手勢識別比較困難，壹般采用關鍵幀法記錄每個手勢的開始和結束狀態以及手勢。

運動軌跡，然後用插值算法重建幀，但還是需要限制。比如戴維斯研究的動態手勢識別，規定手必須在開頭

漲等。手勢的語法信息是通過手的形態和動作來傳遞的。為

為用戶提供必要的視覺反饋信息，讓用戶在交互過程中看到自己的手。

(圖2是用3DSMAX畫的)，也是為了分析手和虛擬人在交互過程中的配對。

為了圖像之間的交互，必須建立手的幾何模型和運動學模型。人的手是壹個多肢系統，由27塊骨頭組成，可以看作是4塊相鄰的骨頭。

手指，壹個拇指和壹個手掌，每個手指由手指節和關節組成。所以這只手

它是由關節連接的結構。隨著關節的運動，手的形狀也在不斷變化。這

這種變化可以用手指段和關節在狀態空間[11]中的位置變化來描述。

每個手指(ⅱ-ⅴ)有四個自由度，其中手指的

基座(MP)有彎曲和旋轉兩個自由度，手指的中間關節(PIP)。

和遠端關節(DIP)分別具有壹個自由度，主要是彎曲運動。拇指

意味著除了像其他四個手指壹樣有四個自由度外，還有壹個外展。

移動，所以拇指有五個自由度(拇指和手掌之間的部分也可以省略)

擔心)。加上手掌運動的兩個自由度。所以手的動作總是有* * *

23個自由度，也就是狀態空間是23維。

從上面的分析可以看出，除了大拇指，每個手指都有四個自由度。

因此，可以建立壹個鏈來協調手指的機制和運動。整只手可以以手掌為基準鏈接五個手指(ⅰ-ⅴ)。

在finger MP上鏈接finger PIP，然後鏈接finger DIP，每個鏈可以得到四個參數。以至於五指以手掌為根節點。

形成樹形結構，樹中的每個節點代表壹個關節，關節通過手指段具有相互關聯的運動特征。

212手勢輸入

手勢輸入是手勢交互的前提。它要求能夠有效地跟蹤手部運動，並且方便用戶的手部運動，這不僅

要求準確確定手的位置、朝向和手指彎曲角度，還要求對手的動作限制很小。目前，手勢的輸入有

基於數據手套和基於視覺(攝像頭)等兩種方式。

21211基於數據手套的手勢輸入

基於數據手套的手勢輸入【12】是根據戴在手上的帶位置跟蹤器的數據手套，用光纖直接測量手。

指彎曲和手的位置來實現手勢輸入。本文使用的是5DT公司生產的不帶位置跟蹤器的第5只手套右手數據。

手套，每個手指的中間關節有壹個傳感器，用來測量手指的平均屈伸，手腕處還有壹個2軸傾斜傳感器。

該設備通過測量手的旋轉(繞Z軸旋轉)和傾斜(繞X軸旋轉)來檢測手的上下擺動和旋轉。這只手套* * *

使用七個傳感器，只能同時讀取七個角度值。第5只手套還提供命令、報告數據、連續數據、模擬。

鼠標等工作模式，可以定義壹指、二指、三指(Z軸)等手勢來控制虛擬手的飛行、視點和移動速度。

第五只手套數據手套通過串行接口與微機連接，傳輸手部動作信號，控制手部動作。它可以

用戶手的手勢被轉換成計算機可讀的數據，從而使手抓取或推動虛擬物體。在人手運動的過程中，

會和物體發生碰撞，所以在系統中，虛擬手的交互操作除了實現抓取和釋放物體的功能，還需要實現碰撞。

測試。

21212基於視覺的手勢輸入

基於視覺的手勢輸入使用攝像機來捕獲手勢圖像，然後使用計算機視覺技術來分析捕獲的圖像。

提取手勢圖像的特征，實現手勢輸入。這種方法使用戶的手的運動較少受到限制，同時，用戶可以直接

看手的形象。基於視覺輸入的原始數據是手部圖像，通過重建三維模型來構建手勢圖像。

關節模型的參數，如手指彎曲角度的夾角，用於合成手的三維圖形。根據手繪圖案和獲得的手形圖像

匹配，得到的模型參數構成手勢。1995，Lee Gintae和Kunii Tosiyasv l .用於研究的立體圖像數據被自動。

分析三維手勢[4]。它利用攝像頭拍攝手部的運動圖像，采用從輪廓中提取邊界特征的方法進行識別，成功提取。

取27個交互手部參數，實現三維手勢的重建。其實早在1981，Kroeger就是用兩個攝像頭實現的。

壹個獲取手勢的系統，在壹個鼠標墊大小的“鏡盒”的3D空間中，通過用戶的手來完成交互。二

壹面鏡子與前平面成45度角放置，兩個鏡子而不是壹個鏡子創建壹個虛擬視點，加上兩個。

兩個攝像頭在垂直平面上的三個視點成直角相交，從而為用戶提供壹定的工作空間，在這個空間中，他們可以允許。

允許用戶與計算機交互。