接收日期:2000年5月-65438+5月
基金項目:產業基金項目(96311)
作者簡介:曾芬芳(1940-),女,湖南益陽人,華東船舶工業學院教授。
執行任務也可以是與人交流,表達某種意思或意圖。基於手勢識別的三維交互輸入技術通常
使用基於數據手套和視覺(如攝像頭)的手勢識別。
人類的手有20多個關節,手勢非常復雜。在虛擬現實的交互過程中,需要分析手勢的形成過程
確定其含義。例如,用戶可以以自然的方式抓取環境中的對象,同時,他們也可以對用戶產生相關的感知反饋,例如那些具有
有力反饋的手套可以讓人感覺到被抓物體的重量,有觸覺反饋的手套可以感覺到使用者觸摸的物體。
質地,比如毯子有多粗糙。所以,計算機要識別人類手部運動的靈活復雜的手勢是很難很難的。
非常有意義的任務。
手勢的分類早在20世紀40年代,心理學家Quek [7]就提出來了。Pavlovic [8]等人從人機界面的角度研究手勢。
按其功能分為:
手部運動
無意識的手部動作
有意識的手部動作(手勢
交流手勢
表格操作
符號(手語)
引用手語(如表示數字)。
模態手勢
執行任務的手勢(如抓錘)不僅是由骨骼肌驅動的,也是由人的信念和意識驅動的,這涉及到人的思維活動的高級行為。
人機交互的研究目的之壹就是讓機器更方便人類用戶。從用戶手勢到系統“感知”手勢的過程[9]如下
如圖1所示。
圖1系統對手勢的“感知”
圖1系統感知手勢的過程
手的動作就是手勢的表達。用戶操作
意圖是用戶想要完成的任務的內容,也就是用戶的心理工作。
移動(概念手勢)G、運動控制(變換)後,使用手勢。
鍛煉h表達。通過感覺裝置(轉換Thi)
運動H轉化為系統的輸入信息I,所以從G到I。
的映射過程是:
Tgh: G → H,即H > Tgh ( G)
Thi: H → I,即I > Thi ( H)
Tgi: G → I,即I > Thi(Tgh(G))& gt;Tgi(克)
其中Tgh是人體運動控制的傳遞函數;這是輸入設備傳遞函數。
手勢識別的任務是從系統輸入I中推斷並確定用戶的意圖G,這顯然是上述映射的逆過程。也就是
G = T- 1
文書主任(壹)(1)
H = T- 1
嗨(壹) (二)
G = T- 1
天然氣水合物(水合物)(3)
其中T- 1
地理標誌,T- 1
妳好,T- 1
Gh是Tgi,Thi,Tgh的逆變換。
所以手勢識別可以采用H = T- 1。
Hi (I)當輸入信息I時,得到手的運動h,然後由G = T- 1。
gh (H)手勢表
來推斷用戶手勢的概念意圖,或者直接從G = T- 1。
Gi (I)找到概念手勢g。
手勢識別分為靜態手勢識別和動態手勢識別。目前大部分的研究都是在線靜態手勢識別,比如Lee的研究。
是靜態孤立手勢[10]。動態手勢識別比較困難,壹般采用關鍵幀法記錄每個手勢的開始和結束狀態以及手勢。
運動軌跡,然後用插值算法重建幀,但還是需要限制。比如戴維斯研究的動態手勢識別,規定手必須在開頭
漲等。手勢的語法信息是通過手的形態和動作來傳遞的。為
為用戶提供必要的視覺反饋信息,讓用戶在交互過程中看到自己的手。
(圖2是用3DSMAX畫的),也是為了分析手和虛擬人在交互過程中的配對。
為了圖像之間的交互,必須建立手的幾何模型和運動學模型。人的手是壹個多肢系統,由27塊骨頭組成,可以看作是4塊相鄰的骨頭。
手指,壹個拇指和壹個手掌,每個手指由手指節和關節組成。所以這只手
它是由關節連接的結構。隨著關節的運動,手的形狀也在不斷變化。這
這種變化可以用手指段和關節在狀態空間[11]中的位置變化來描述。
每個手指(ⅱ-ⅴ)有四個自由度,其中手指的
基座(MP)有彎曲和旋轉兩個自由度,手指的中間關節(PIP)。
和遠端關節(DIP)分別具有壹個自由度,主要是彎曲運動。拇指
意味著除了像其他四個手指壹樣有四個自由度外,還有壹個外展。
移動,所以拇指有五個自由度(拇指和手掌之間的部分也可以省略)
擔心)。加上手掌運動的兩個自由度。所以手的動作總是有* * *
23個自由度,也就是狀態空間是23維。
從上面的分析可以看出,除了大拇指,每個手指都有四個自由度。
因此,可以建立壹個鏈來協調手指的機制和運動。整只手可以以手掌為基準鏈接五個手指(ⅰ-ⅴ)。
在finger MP上鏈接finger PIP,然後鏈接finger DIP,每個鏈可以得到四個參數。以至於五指以手掌為根節點。
形成樹形結構,樹中的每個節點代表壹個關節,關節通過手指段具有相互關聯的運動特征。
212手勢輸入
手勢輸入是手勢交互的前提。它要求能夠有效地跟蹤手部運動,並且方便用戶的手部運動,這不僅
要求準確確定手的位置、朝向和手指彎曲角度,還要求對手的動作限制很小。目前,手勢的輸入有
基於數據手套和基於視覺(攝像頭)等兩種方式。
21211基於數據手套的手勢輸入
基於數據手套的手勢輸入【12】是根據戴在手上的帶位置跟蹤器的數據手套,用光纖直接測量手。
指彎曲和手的位置來實現手勢輸入。本文使用的是5DT公司生產的不帶位置跟蹤器的第5只手套右手數據。
手套,每個手指的中間關節有壹個傳感器,用來測量手指的平均屈伸,手腕處還有壹個2軸傾斜傳感器。
該設備通過測量手的旋轉(繞Z軸旋轉)和傾斜(繞X軸旋轉)來檢測手的上下擺動和旋轉。這只手套* * *
使用七個傳感器,只能同時讀取七個角度值。第5只手套還提供命令、報告數據、連續數據、模擬。
鼠標等工作模式,可以定義壹指、二指、三指(Z軸)等手勢來控制虛擬手的飛行、視點和移動速度。
第五只手套數據手套通過串行接口與微機連接,傳輸手部動作信號,控制手部動作。它可以
用戶手的手勢被轉換成計算機可讀的數據,從而使手抓取或推動虛擬物體。在人手運動的過程中,
會和物體發生碰撞,所以在系統中,虛擬手的交互操作除了實現抓取和釋放物體的功能,還需要實現碰撞。
測試。
21212基於視覺的手勢輸入
基於視覺的手勢輸入使用攝像機來捕獲手勢圖像,然後使用計算機視覺技術來分析捕獲的圖像。
提取手勢圖像的特征,實現手勢輸入。這種方法使用戶的手的運動較少受到限制,同時,用戶可以直接
看手的形象。基於視覺輸入的原始數據是手部圖像,通過重建三維模型來構建手勢圖像。
關節模型的參數,如手指彎曲角度的夾角,用於合成手的三維圖形。根據手繪圖案和獲得的手形圖像
匹配,得到的模型參數構成手勢。1995,Lee Gintae和Kunii Tosiyasv l .用於研究的立體圖像數據被自動。
分析三維手勢[4]。它利用攝像頭拍攝手部的運動圖像,采用從輪廓中提取邊界特征的方法進行識別,成功提取。
取27個交互手部參數,實現三維手勢的重建。其實早在1981,Kroeger就是用兩個攝像頭實現的。
壹個獲取手勢的系統,在壹個鼠標墊大小的“鏡盒”的3D空間中,通過用戶的手來完成交互。二
壹面鏡子與前平面成45度角放置,兩個鏡子而不是壹個鏡子創建壹個虛擬視點,加上兩個。
兩個攝像頭在垂直平面上的三個視點成直角相交,從而為用戶提供壹定的工作空間,在這個空間中,他們可以允許。
允許用戶與計算機交互。