ACM Multimedia 2012 Conference & Workshops Proceedings

MM 2012 Proceedings

Kiyoharu Aizawa, Noboru Babaguchi, John R. Smith (Eds.), Proceedings of the 2012 ACM Multimedia Conference, MM '12, October 29�November 2, 2012, Nara, Japan. ACM 2012, ISBN 978-1-4503-1589-5.

Table of Contents

Message from the General Chairs
Kiyoharu Aizawa (The University of Tokyo)
Noboru Babaguchi (Osaka University)
John R. Smith (IBM T.J. Watson Research Center)

Message from the Technical Program Chairs
Shin'ichi Satoh (National Institute of Informatics)
Thomas Plagemann (University of Oslo)
Xian-Sheng Hua (Microsoft)
Rong Yan (Facebook)

Message from the ACM SIGMM Chair
Klara Nahrstedt (University of Ilinois at Urbana-Champaign)

MM 2012 Conference Organization

MM 2012 Technical Program Committee

MM 2012 Technical Demo Program Committee

MM 2012 Area Chairs

MM 2012 Additional Reviewers

MM 2012 Sponsor & Supporters

(Return to Top)

Link to a Complete Table of Contents
Plenary Talk 1	Full Paper Session 15: Image Content Analysis
Panel 1: 20th Anniversary Panel	Full Paper Session 16: Social Media
Plenary Talk 2	Poster Session 1
Panel 2: Panel Discussion	Poster Session 2
Best Paper Session	Poster Session 3
Full Paper Session 1: Content-Based Image Retrieval	Brave New Ideas Program
Full Paper Session 2: Audio and Music	Technical Demo Session 1
Full Paper Session 3: Video Applications	Technical Demo Session 2
Full Paper Session 4: Large Scale Search	Technical Demo Session 3
Full Paper Session 5: Person and Face Analysis	Multimedia Grand Challenge
Full Paper Session 6: Video Distribution	Doctoral Symposium Session 1: Best Paper Session
Full Paper Session 7: Visual Search	Doctoral Symposium 2: Oral Paper Session
Full Paper Session 8: Human-centric Media	Doctoral Symposium 3: Poster Session
Full Paper Session 9: Presentation and Organization	Open Source Software Competition
Full Paper Session 10: Haptics	Video Program
Full Paper Session 11: Event Recognition	Multimedia Art Exhibition
Full Paper Session 12: Semantic Tagging	Workshop Summaries
Full Paper Session 13: Image Analysis	Tutorial Overviews
Full Paper Session 14: Mobile Systems

(Return to Top)

Technical Demo Session 1
Session Chair: Hirokazu Kato (NAIST)

Face Replacement with Large-Pose Differences (Page 1249)
Yuan Lin (Tsinghua University)
Qian Lin (HP Labs)
Feng Tang (HP Labs)
Shengjin Wang (Tsinghua University)

TouchPaper: Making Print Interactive (Page 1251)
Feng Tang (Hewlett-Packard Laboratories)
Hao Tang (Hewlett-Packard Laboratories)
Daniel R. Tretter (Hewlett-Packard Laboratories)
Qian Lin (Hewlett-Packard Laboratories)

	QuickToon: A Real-Time Video Stylization and Sharing System on General Processors (Page 1253) Hongsheng Yang (Advanced Digital Sciences Center) Huanliang Sun (Advanced Digital Sciences Center) Jiangbo Lu (Advanced Digital Sciences Center)
	Sketch2Tag: Automatic Hand-Drawn Sketch Recognition (Page 1255) Zhenbang Sun (Shanghai Jiao Tong University) Changhu Wang (Microsoft Research Asia) Liqing Zhang (Shanghai Jiao Tong University) Lei Zhang (Microsoft Research Asia)

A Rapid Flower/Leaf Recognition System (Page 1257)
Xianbiao Qi (Beijing University of Posts and Telecommunications)
Rong Xiao (Microsoft Research Asia)
Lei Zhang (Microsoft Research Asia)
Chun-Guang Li (Beijing University of Posts and Telecommunications)
Jun Guo (Beijing University of Posts and Telecommunications)

(Return to Top)

A Tool for Automatic Cinemagraphs (Page 1259)
Mei-Chen Yeh (National Taiwan Normal University)
Po-Yi Li (National Taiwan Normal University)

	Actions Speak Louder than Words: Searching Human Action Video Based on Body Movement (Page 1261) Yan-Ching Lin (Academia Sinica) Min-Chun Hu (Academia Sinica & National Cheng Kung University) Wen-Huang Cheng (Academia Sinica) Yung-Huan Hsieh (Academia Sinica) Hong-Ming Chen (Academia Sinica)
	Action Tutor: Real-Time Exemplar-based Sequential Movement Assessment with Kinect Sensor (Page 1263) Chi-Wen Chen (National Taiwan University) Min-Chun Hu (Academia Sinica) Wen-Huang Cheng (Academia Sinica) Che-Han Chang (National Taiwan University) Jui-Hsin Lai (National Taiwan University) Ja-Ling Wu (National Taiwan University)
	Jiku Live: A Live Zoomable Video Streaming System (Page 1265) Arash Shafiei (National University of Singapore) Ngo Quang Minh Khiem (National University of Singapore) Guntur Ravindra (National University of Singapore) Mukesh Saini (National University of Singapore) Cong Pang (National University of Singapore) Wei Tsang Ooi (National University of Singapore)

Smart VideoCooKing: A Multimedia Cooking Recipe Browsing Application on Portable Devices (Page 1267)
Keisuke Doman (Nagoya University)
Cheng Ying Kuai (Nagoya University)
Tomokazu Takahashi (Gakuen University)
Ichiro Ide (Nagoya University)
Hiroshi Murase (Nagoya University)

Through the Looking Glass: Mirror Worlds for Augmented Awareness & Capability (Page 1269)
Don Kimber (FX Palo Alto Laboratory, Inc.)
Jun Shingu (Fuji Xerox)
Jim Vaughan (FX Palo Alto Laboratory, Inc.)
David Arendash (FX Palo Alto Laboratory, Inc.)
David Lee (FX Palo Alto Laboratory, Inc.)
Maribeth Back (FX Palo Alto Laboratory, Inc.)
Shingo Uchihashi (Fuji Xerox)

LikeLines: Collecting Timecode-Level Feedback for Web Videos Through User Interactions (Page 1271)
Raynor Vliegendhart (Delft University of Technology)
Martha Larson (Delft University of Technology)
Alan Hanjalic (Delft University of Technology)

Exploring and Browsing Photos Through Characteristic Geographic Tag Regions (Page 1273)
Bart Thomee (Yahoo! Research)
Adam Rae (Yahoo! Research)

(Return to Top)

	Rapid Object Search Engine for Contextual Advertisement (Page 1275) Yuning Jiang (Nanyang Technological University) Junsong Yuan (Nanyang Technological University) Jingjing Meng (Nanyang Technological University)
	Multi-View Video Contents Viewing System by Synchronized Multi-view Streaming Architecture (Page 1277) Takafumi Marutani (Nagoya University) Kenji Mase (Nagoya University) Toshiaki Fujii (Nagoya University) Tetsuya Kawamoto (Chukyo TV Broadcasting Co. Ltd.)
	X-Large Virtual Workspaces for Projector Phones Through Peephole Interaction (Page 1279) Bonifaz Kaufmann (Alpen-Adria-Universit�t Klagenfurt) Martin Hitz (Alpen-Adria-Universit�t Klagenfurt)

Demo: Virtual Director for Live Event Broadcast (Page 1281)
Rene Kaiser (Joanneum Research)
Wolfgang Weiss (Joanneum Research)
Malte Borsum (Technicolor)
Axel Kochale (Technicolor)
Marco Masetti (Softeco Sismat)
Valentina Zampichelli (Softeco Sismat)

Fly-through Heijo Palace Site: Historical Tourism System Using Augmented Telepresence (Page 1283)
Fumio Okura (Nara Institute of Science and Technology)
Masayuki Kanbara (Nara Institute of Science and Technology)
Naokazu Yokoya (Nara Institute of Science and Technology)

Mobile Multimedia Presentation in Self-Forming Mobile Device Groups: Ad-Hoc Networks in Practice (Page 1285)
Kevin Collins (Dublin City University)
Noel E. O'Connor (Dublin City University)
Gabriel Miro Muntean (Dublin City University)

Eyeke: What You Hear Is What You See (Page 1287)
Takeshi Okunaka (Ryukoku University)
Yoshinobu Tonomura (Ryukoku University)

System for Creating Slideshows Based on People and Their Emotions (Page 1289)
Vassilios Vonikakis (Advanced Digital Sciences Center & University of Illinois at Urbana-Champaign)
Stefan Winkler (Advanced Digital Sciences Center & University of Illinois at Urbana-Champaign)

gTravel: A Global Social Travel System (Page 1291)
Richong Zhang (Beihang University)
Xiaohui Guo (Beihang University)
Hailong Sun (Beihang University)
Jinpeng Huai (Beihang University)
Xudong Liu (Beihang University)

(Return to Top)

Technical Demo Session 2
Session Chair: Qi Tian (University of Texas at San Antonio)

Interactive Music Video Application for Smartphones Based on Free-Viewpoint Video and Audio Rendering (Page 1293)
Toshiharu Horiuchi (KDDI R&D Laboratories, Inc.)
Hiroshi Sankoh (KDDI R&D Laboratories, Inc.)
Tsuneo Kato (KDDI R&D Laboratories, Inc.)
Sei Naito (KDDI R&D Laboratories, Inc.)

Abnormal Behavior Recognition System for ATM Monitoring by RGB-D Camera (Page 1295)
Fan Liu (Nanjing University of Science and Technology)
Jinhui Tang (Nanjing University of Science and Technology)
Ruizhen Zhao (Beijing Jiaotong University)
Zhenmin Tang (Nanjing University of Science and Technology)

Interactive Photomosaic System Using GPU (Page 1297)
Makoto Fujisawa (University of Tsukuba)
Toshiyuki Amano (Yamagata University)
Takafumi Taketomi (Nara Institute of Science and Technology)
Goshiro Yamamoto (Nara Institute of Science and Technology)
Yuki Uranishi (Nara Institute of Science and Technology)
Jun Miyazaki (Nara Institute of Science and Technology)

PhacePhinder: Harnessing Social Networks to Build Social Face Databases for Mobile Devices (Page 1299)
Mark Bloess (University of Ottawa)
Heung-Nam Kim (University of Ottawa)
Abdulmotaleb El Saddik (University of Ottawa)

(Return to Top)

Real-Time Multiple Object Instances Detection (Page 1301)
Chengli Xie (Chinese Academy of Sciences)
Jinqiao Wang (Chinese Academy of Sciences)
Yifan Zhang (Chinese Academy of Sciences)
Hanqing Lu (Chinese Academy of Sciences)

One Shot Learning Gesture Recognition with Kinect Sensor (Page 1303)
Di Wu (The University of Sheffield)
Fan Zhu (The University of Sheffield)
Ling Shao (The University of Sheffield)
Hui Zhang (United International College)

Interactive Exploration of Large Remote Image Databases (Page 1305)
William Plant (Aston University)
Gerald Schaefer (Loughborough University)

Scenario-Driven Interactive Panorama Video Delivery: Promptly Watch and Share Enjoyable Parts of an Event (Page 1307)
Daisuke Ochi (Nippon Telegraph and Telephone Corporation)
Hideaki Kimata (Nippon Telegraph and Telephone Corporation)
Hajime Noto (Nippon Telegraph and Telephone Corporation)
Akira Kojima (Nippon Telegraph and Telephone Corporation)

	MOGAT: A Cloud-Based Mobile Game System with Auditory Training for Children with Cochlear Implants (Page 1309) Yinsheng Zhou (National University of Singapore) Toni-Jan Keith P. Monserrat (National University of Singapore) Ye Wang (National University of Singapore)
	A Domain-Specific Music Search Engine for Gait Training (Page 1311) Zhonghua Li (National University of Singapore) Ye Wang (National University of Singapore)

(Return to Top)

A Daily, Activity-Aware, Mobile Music Recommender System (Page 1313)
Xinxi Wang (National University of Singapore)
David Rosenblum (National University of Singapore)
Ye Wang (National University of Singapore)

Use of Invisible Noise Signals to Prevent Privacy Invasion Through Face Recognition from Camera Images (Page 1315)
Takayuki Yamada (Graduate University for Advanced Studies)
Seiichi Gohshi (Kogakuin University)
Isao Echizen (National Institute of Informatics)

	DVS: A Dynamic Multi-Video Summarization System of Sensor-Rich Videos in Geo-Space (Page 1317) Ying Zhang (National University of Singapore) Roger Zimmermann (National University of Singapore)
	Motch: An Automatic Motion Type Characterization System for Sensor-Rich Videos (Page 1319) Guanfeng Wang (National University of Singapore) Beomjoo Seo (National University of Singapore) Roger Zimmermann (National University of Singapore)
	Hummi-Com: Humming-based Music Composition System (Page 1321) Tetsuro Kitahara (Nihon University) Syohei Kimura (Nihon University) Yuu Suzuki (Nihon University) Tomofumi Suzuki (Nihon University)

(Return to Top)

Technical Demo Session 3
Session Chair: Hirokazu Kato (NAIST)

Browse-to-Search (Page 1323)
Shiyang Lu (The University of Sydney)
Tao Mei (Microsoft Research Asia)
Jingdong Wang (Microsoft Research Asia)
Jian Zhang (University of Technology, Sydney)
Zhiyong Wang (The University of Sydney)
David Dagan Feng (The University of Sydney)
Jian-Tao Sun (Microsoft Research Asia)
Shipeng Li (Microsoft Research Asia)

Scalable Similar Image Search by Joint Indices (Page 1325)
Jing Wang (Peking University)
Jingdong Wang (Microsoft Research Asia)
Xian-Sheng Hua (Microsoft Bing)
Shipeng Li (Microsoft Research Asia)

Color Filter for Image Search (Page 1327)
Peng Wang (Peking University)
Dongqing Zhang (Shanghai Jiao Tong University)
Jingdong Wang (Microsoft Research Asia)
Zhong Wu (Microsoft Bing)
Xian-Sheng Hua (Microsoft Bing)
Shipeng Li (Microsoft Research Asia)

StoViz : Story Visualization of TV Series (Page 1329)
Philippe Ercolessi (University Paul Sabatier)
Herv� Bredin (LIMSI - CNRS)
Christine S�nac (University Paul Sabatier)

(Return to Top)

3DME: 3D Media Express from RGB-D Images (Page 1331)
Tam V. Nguyen (National University of Singapore)
Lusong Li (National University of Singapore)
Jun Tan (National University of Singapore)
Shuicheng Yan (National University of Singapore)

"Hi, Magic Closet, Tell Me What to Wear!" (Page 1333)
Si Liu (National University of Singapore)
Tam V. Nguyen (National University of Singapore)
Jiashi Feng (National University of Singapore)
Meng Wang (Hefei University of Technology)
Shuicheng Yan (National University of Singapore)

Street-to-Shop: Cross-Scenario Clothing Retrieval via Parts Alignment and Auxiliary Set (Page 1335)
Si Liu (National University of Singapore & Chinese Academy of Sciences)
Zheng Song (National University of Singapore)
Meng Wang (Hefei University of Technology)
Changsheng Xu (Chinese Academy of Sciences)
Hanqing Lu (Chinese Academy of Sciences)
Shuicheng Yan (National University of Singapore)

Searching for Diversified Landmarks by Photo (Page 1337)
Junfeng Ye (Shanghai Jiao Tong University)
Jia Chen (Shanghai Jiao Tong University)
Zejia Chen (Shanghai Jiao Tong University)
Yihe Zhu (Shanghai Jiao Tong University)
Shenghua Bao (IBM China Research Laboratory)
Zhong Su (IBM China Research Laboratory)
Yong Yu (Shanghai Jiao Tong University)

Attribute Feedback (Page 1339)
Hanwang Zhang (National University of Singapore)
Zheng-Jun Zha (National University of Singapore)
Jingwen Bian (National University of Singapore)
Yue Gao (National University of Singapore)
Huanbo Luan (National University of Singapore)
Tat-Seng Chua (National University of Singapore)

(Return to Top)

Personal Photo Indexing (Page 1341)
Ivan Tankoyeu (Universtiy of Trento)
Julian St�ttinger (Universtiy of Trento)
Javier Paniagua (Universtiy of Trento)
Fausto Giunchiglia (Universtiy of Trento)

	Guess What You Draw: Interactive Contour-based Image Retrieval on a Million-Scale Database (Page 1343) Rong Zhou (Shanghai Jiao Tong University) Liuli Chen (Shanghai Jiao Tong University) Liqing Zhang (Shanghai Jiao Tong University)
	FashionAsk: Pushing Community Answers to Your Fingertips (Page 1345) Wei Zhang (City University of Hong Kong) Lei Pang (City University of Hong Kong) Chong-Wah Ngo (City University of Hong Kong)

A Fast Video Event Recognition System and Its Application to Video Search (Page 1347)
Yu-Gang Jiang (Fudan University)
Qi Dai (Fudan University)
Yingbin Zheng (Fudan University)
Xiangyang Xue (Fudan University)
Jie Liu (Huawei Technologies)
Dong Wang (Huawei Technologies)

Social and Automatic Annotation of Videos for Semantic Profiling and Content Discovery (Page 1349)
Marco Bertini (Universit� degli Studi di Firenze)
Alberto Del Bimbo (Universit� degli Studi di Firenze)
Andrea Ferracani (Universit� degli Studi di Firenze)
Daniele Pezzatini (Universit� degli Studi di Firenze)

(Return to Top)

Multimedia Grand Challenge
Session Chairs: Marcel Worring (University of Amsterdam) and Yushi Jing (Google Research)

Visual-Based Transmedia Events Detection (Page 1351)
Alexis Joly (INRIA Zenith)
Julien Champ (INRIA Zenith)
Pierre Letessier (INRA/INA)
Nicolas Herv� (INA)
Olivier Buisson (INA)
Marie-Luce Viaud (INA)

Technicolor Challenge: An Event Classification Framework by Probabilistic Context Modeling of Multimodal Features (Page 1353)
Hsuan-Sheng Chen (National Chiao-Tung University)
Wen-Jiin Tsai (National Chiao-Tung University)

TWIPIX: A Web Magazine Curated from Social Media (Page 1355)
Romil Bansal (Tata Consultancy Services)
Radhika Kumaran (Tata Consultancy Services)
Diwakar Mahajan (Tata Consultancy Services)
Arpit Khurdiya (Tata Consultancy Services)
Lipika Dey (Tata Consultancy Services)
Hiranmay Ghosh (Tata Consultancy Services)

Multimedia News Digger on Emerging Topics from Social Streams (Page 1357)
Bing-Kun Bao (Chinese Academy of Sciences & China -Singapore Institute of Digital Media)
Weiqing Min (Chinese Academy of Sciences)
Jitao Sang (Chinese Academy of Sciences)
Changsheng Xu (Chinese Academy of Sciences)

(Return to Top)

Analyzing Social Media via Event Facets (Page 1359)
Zhiyu Wang (Tsinghua University)
Peng Cui (Tsinghua University)
Lexing Xie (Australian National University and NICTA)
Hao Chen (Tsinghua University)
Wenwu Zhu (Tsinghua University)
Shiqiang Yang (Tsinghua University)

Automatic Cinemagraphs for Ranking Beautiful Scenes (Page 1361)
Yin-Tzu Chan (National Taiwan Normal University)
Hao-Chen Hsu (National Taiwan Normal University)
Po-Yi Li (National Taiwan Normal University)
Mei-Chen Yeh (National Taiwan Normal University)

"Where is the Interestingness?" Retrieving Appealing Video Scenes by Learning Flickr-based Graded Judgments (Page 1363)
Miriam Redi (EURECOM)
Bernard Merialdo (EURECOM)

Scaring or Pleasing: Exploit Emotional Impact of an Image (Page 1365)
Bing Li (Chinese Academy of Sciences)
Songhe Feng (Beijing Jiaotong University)
Weihua Xiong (Chinese Academy of Sciences)
Weiming Hu (Chinese Academy of Sciences)

Classification of Photos Based on Good Feelings: ACM MM 2012 Multimedia Grand Challenge Submission (Page 1367)
Mathias Lux (Klagenfurt University)
Mario Taschwer (Klagenfurt University)
Oge Marques (Florida Atlantic University)

Understanding the Emotional Impact of Images (Page 1369)
Xiaohui Wang (Tsinghua University)
Jia Jia (Tsinghua University)
Peiyun Hu (Tsinghua University)
Sen Wu (Tsinghua University)
Jie Tang (Tsinghua University)
Lianhong Cai (Tsinghua University)

(Return to Top)

Emotion-Based Sequence of Family Photos (Page 1371)
Vassilios Vonikakis (Advanced Digital Sciences Center & University of Illinois at Urbana-Champaign)
Stefan Winkler (Advanced Digital Sciences Center & University of Illinois at Urbana-Champaign)

Evaluating User's Energy Consumption Using Kinect Based Skeleton Tracking (Page 1373)
Zhenbao Liu (Northwestern Polytechnical University)
Sicong Tang (Northwestern Polytechnical University)
Hongliang Qin (Northwestern Polytechnical University)
Shuhui Bu (Northwestern Polytechnical University)

Analysis of Dance Movements Using Gaussian Processes (Page 1375)
Antoine Liutkus (Telecom ParisTech)
Ang�lique Dremeau (Telecom ParisTech)
Dimitrios Alexiadis (Hellas, Information Technologies Institute)
Slim Essid (Telecom ParisTech)
Petros Daras (Hellas, Information Technologies Institute)

Automatic Music Soundtrack Generation for Outdoor Videos from Contextual Sensor Information (Page 1377)
Yi Yu (National University of Singapore)
Zhijie Shen (National University of Singapore)
Roger Zimmermann (National University of Singapore)

The Acousticvisual Emotion Guassians Model for Automatic Generation of Music Video (Page 1379)
Ju-Chiang Wang (Academia Sinica & National Taiwan University)
Yi-Hsuan Yang (Academia Sinica)
I-Hong Jhuo (National Taiwan University)
Yen-Yu Lin (Academia Sinica)
Hsin-Min Wang (Academia Sinica)

Automatic Music Video Generation: Cross Matching of Music and Image (Page 1381)
Xixuan Wu (Chinese Academy of Sciences & The Chinese University of Hong Kong)
Bing Xu (The Chinese University of Hong Kong)
Yu Qiao (Chinese Academy of Sciences)
Xiaoou Tang (Chinese Academy of Sciences & The Chinese University of Hong Kong)

MuseSync: Standing on the Shoulders of Hollywood (Page 1383)
Cynthia C. S. Liem (Delft University of Technology)
Alessio Bazzica (University of Firenze)
Alan Hanjalic (Delft University of Technology)