當前位置:股票大全官網 - 基金投資 - 手勢輸入模式下手勢識別的原理

手勢輸入模式下手勢識別的原理

手勢是指人的雙手在人的意識控制下所做出的各種動作,如手指彎曲、伸展和手部在空間的運動,可以是

接收日期:2000年5月-65438+5月

基金項目:產業基金項目(96311)

作者簡介:曾芬芳(1940-),女,湖南益陽人,華東船舶工業學院教授。

執行任務也可以是與人交流,表達某種意思或意圖。基於手勢識別的三維交互輸入技術通常

使用基於數據手套和視覺(如攝像頭)的手勢識別。

人類的手有20多個關節,手勢非常復雜。在虛擬現實的交互過程中,需要分析手勢的形成過程

確定其含義。例如,用戶可以以自然的方式抓取環境中的對象,同時,他們也可以對用戶產生相關的感知反饋,例如那些具有

有力反饋的手套可以讓人感覺到被抓物體的重量,有觸覺反饋的手套可以感覺到使用者觸摸的物體。

質地,比如毯子有多粗糙。所以,計算機要識別人類手部運動的靈活復雜的手勢是很難很難的。

非常有意義的任務。

手勢的分類早在20世紀40年代,心理學家Quek [7]就提出來了。Pavlovic [8]等人從人機界面的角度研究手勢。

按其功能分為:

手部運動

無意識的手部動作

有意識的手部動作(手勢

交流手勢

表格操作

符號(手語)

引用手語(如表示數字)。

模態手勢

執行任務的手勢(如抓錘)不僅是由骨骼肌驅動的,也是由人的信念和意識驅動的,這涉及到人的思維活動的高級行為。

人機交互的研究目的之壹就是讓機器更方便人類用戶。從用戶手勢到系統“感知”手勢的過程[9]如下

如圖1所示。

圖1系統對手勢的“感知”

圖1系統感知手勢的過程

手的動作就是手勢的表達。用戶操作

意圖是用戶想要完成的任務的內容,也就是用戶的心理工作。

移動(概念手勢)G、運動控制(變換)後,使用手勢。

鍛煉h表達。通過感覺裝置(轉換Thi)

運動H轉化為系統的輸入信息I,所以從G到I。

的映射過程是:

Tgh: G → H,即H > Tgh ( G)

Thi: H → I,即I > Thi ( H)

Tgi: G → I,即I > Thi(Tgh(G))& gt;Tgi(克)

其中Tgh是人體運動控制的傳遞函數;這是輸入設備傳遞函數。

手勢識別的任務是從系統輸入I中推斷並確定用戶的意圖G,這顯然是上述映射的逆過程。也就是

G = T- 1

文書主任(壹)(1)

H = T- 1

嗨(壹) (二)

G = T- 1

天然氣水合物(水合物)(3)

其中T- 1

地理標誌,T- 1

妳好,T- 1

Gh是Tgi,Thi,Tgh的逆變換。

所以手勢識別可以采用H = T- 1。

Hi (I)當輸入信息I時,得到手的運動h,然後由G = T- 1。

gh (H)手勢表

來推斷用戶手勢的概念意圖,或者直接從G = T- 1。

Gi (I)找到概念手勢g。

手勢識別分為靜態手勢識別和動態手勢識別。目前大部分的研究都是在線靜態手勢識別,比如Lee的研究。

是靜態孤立手勢[10]。動態手勢識別比較困難,壹般采用關鍵幀法記錄每個手勢的開始和結束狀態以及手勢。

運動軌跡,然後用插值算法重建幀,但還是需要限制。比如戴維斯研究的動態手勢識別,規定手必須在開頭

漲等。手勢的語法信息是通過手的形態和動作來傳遞的。為

為用戶提供必要的視覺反饋信息,讓用戶在交互過程中看到自己的手。

(圖2是用3DSMAX畫的),也是為了分析手和虛擬人在交互過程中的配對。

為了圖像之間的交互,必須建立手的幾何模型和運動學模型。人的手是壹個多肢系統,由27塊骨頭組成,可以看作是4塊相鄰的骨頭。

手指,壹個拇指和壹個手掌,每個手指由手指節和關節組成。所以這只手

它是由關節連接的結構。隨著關節的運動,手的形狀也在不斷變化。這

這種變化可以用手指段和關節在狀態空間[11]中的位置變化來描述。

每個手指(ⅱ-ⅴ)有四個自由度,其中手指的

基座(MP)有彎曲和旋轉兩個自由度,手指的中間關節(PIP)。

和遠端關節(DIP)分別具有壹個自由度,主要是彎曲運動。拇指

意味著除了像其他四個手指壹樣有四個自由度外,還有壹個外展。

移動,所以拇指有五個自由度(拇指和手掌之間的部分也可以省略)

擔心)。加上手掌運動的兩個自由度。所以手的動作總是有* * *

23個自由度,也就是狀態空間是23維。

從上面的分析可以看出,除了大拇指,每個手指都有四個自由度。

因此,可以建立壹個鏈來協調手指的機制和運動。整只手可以以手掌為基準鏈接五個手指(ⅰ-ⅴ)。

在finger MP上鏈接finger PIP,然後鏈接finger DIP,每個鏈可以得到四個參數。以至於五指以手掌為根節點。

形成樹形結構,樹中的每個節點代表壹個關節,關節通過手指段具有相互關聯的運動特征。

212手勢輸入

手勢輸入是手勢交互的前提。它要求能夠有效地跟蹤手部運動,並且方便用戶的手部運動,這不僅

要求準確確定手的位置、朝向和手指彎曲角度,還要求對手的動作限制很小。目前,手勢的輸入有

基於數據手套和基於視覺(攝像頭)等兩種方式。

21211基於數據手套的手勢輸入

基於數據手套的手勢輸入【12】是根據戴在手上的帶位置跟蹤器的數據手套,用光纖直接測量手。

指彎曲和手的位置來實現手勢輸入。本文使用的是5DT公司生產的不帶位置跟蹤器的第5只手套右手數據。

手套,每個手指的中間關節有壹個傳感器,用來測量手指的平均屈伸,手腕處還有壹個2軸傾斜傳感器。

該設備通過測量手的旋轉(繞Z軸旋轉)和傾斜(繞X軸旋轉)來檢測手的上下擺動和旋轉。這只手套* * *

使用七個傳感器,只能同時讀取七個角度值。第5只手套還提供命令、報告數據、連續數據、模擬。

鼠標等工作模式,可以定義壹指、二指、三指(Z軸)等手勢來控制虛擬手的飛行、視點和移動速度。

第五只手套數據手套通過串行接口與微機連接,傳輸手部動作信號,控制手部動作。它可以

用戶手的手勢被轉換成計算機可讀的數據,從而使手抓取或推動虛擬物體。在人手運動的過程中,

會和物體發生碰撞,所以在系統中,虛擬手的交互操作除了實現抓取和釋放物體的功能,還需要實現碰撞。

測試。

21212基於視覺的手勢輸入

基於視覺的手勢輸入使用攝像機來捕獲手勢圖像,然後使用計算機視覺技術來分析捕獲的圖像。

提取手勢圖像的特征,實現手勢輸入。這種方法使用戶的手的運動較少受到限制,同時,用戶可以直接

看手的形象。基於視覺輸入的原始數據是手部圖像,通過重建三維模型來構建手勢圖像。

關節模型的參數,如手指彎曲角度的夾角,用於合成手的三維圖形。根據手繪圖案和獲得的手形圖像

匹配,得到的模型參數構成手勢。1995,Lee Gintae和Kunii Tosiyasv l .用於研究的立體圖像數據被自動。

分析三維手勢[4]。它利用攝像頭拍攝手部的運動圖像,采用從輪廓中提取邊界特征的方法進行識別,成功提取。

取27個交互手部參數,實現三維手勢的重建。其實早在1981,Kroeger就是用兩個攝像頭實現的。

壹個獲取手勢的系統,在壹個鼠標墊大小的“鏡盒”的3D空間中,通過用戶的手來完成交互。二

壹面鏡子與前平面成45度角放置,兩個鏡子而不是壹個鏡子創建壹個虛擬視點,加上兩個。

兩個攝像頭在垂直平面上的三個視點成直角相交,從而為用戶提供壹定的工作空間,在這個空間中,他們可以允許。

允許用戶與計算機交互。