Equipe BD
Equipe BD
Laboratoire d'InfoRmatique en Images et Systèmes d'information
UMR 5205 CNRS/INSA de Lyon/Université Claude Bernard Lyon 1/Université Lumière Lyon 2/Ecole Centrale de Lyon

You are here

Group seminars

Here is a list of the various seminars that were given at the database group.
You may suscribe to our iCal calendar : http://projet.liris.cnrs.fr/bd/?q=calendrier_bd/ical

Ordinary seminars take place :

  • at INSA-LYON on EVEN week numbers, at the Liris meeting room, Blaise Pascal building;
  • at UNIV-LYON1 on ODD week numbers, at the C5 room, Nautibus building.

Mining Highly Dynamic Graphs

Qui: 
Serafeim PAPADIAS
Quand: 
Thursday, September 5, 2024 - 14:00 to 15:00
Où: 
visio

Dynamic graphs, which continuously evolve, require advanced methods for processing and updating computations efficiently. My PhD thesis addresses this by developing innovative incremental algorithms for three key problems: random walks, butterfly counting, and overlapping community detection. I introduce Wharf, a parallel system that uses compressed purely functional binary trees and pairing functions for efficient random walk updates, outperforming existing methods.

Compression Techniques for Reachability and Historical Reachability Queries

Qui: 
John WANG
Quand: 
Monday, September 2, 2024 - 14:00 to 15:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle de réunion, 2ème étage

In this talk, I will first provide a quick overview of our works in the area of graph query processing. Then I will provide some details on our works on answering reachability and historical reachability queries. A reachability query asks, given two vertices u and v in a directed graph G, whether u can reach v, that is, whether there is a path from u to v in G. This problem has been well studied and there is a large body of literature. We show how a multi-level compression technique can speed-up reachability query answering.

Taming the Cost of Deep Neural Models: Hybrid Models to the Rescue?

Qui: 
Laks LAKSHMANAN
Quand: 
Thursday, June 20, 2024 - 11:00 to 12:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C4

Deep learning, and in particular, large language models have made great strides in many fields including vision, language, and medicine. The impressive performance of large models comes at a significant price: the models tend to be billions to trillions of parameters in size, are expensive to train, have a huge operational cost, and typically need cloud service for deployment. Meanwhile, considerable research efforts have been devoted to designing smaller/cheaper models, at the price of restricted generalizability and performance. Not all queries we may wish to pose to a model are hard.

Building Data Management Systems for Precision Medicine: Lessons Learnt from Five National Flagship Projects

Qui: 
Irini FUNDULAKI
Quand: 
Thursday, February 15, 2024 - 11:00 to 12:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C1

In this talk we are going to discuss our experience in building a real ICT Ecosystem to support the data life cycle for Precision Medicine Projects and provide our thoughts on how to use knowledge graphs methods for managing the data and produced knowledge. The systems are used by clinicians to record clinical and genomic data and support a fully digitized data life cycle.

Data Science for Social Goods: STAR Lab’s Experience

Qui: 
Reynold CHENG
Quand: 
Friday, December 15, 2023 - 10:00 to 11:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C4

In many metropolitan cities, there is a lack of manpower in social care. In Hong Kong, for example, the elderly care homes report a 70% shortage of employees. To alleviate these issues, recently there is a lot of attention on “data science for social goods”, or the use of technologies for enhancing service quality and streamlining administrative work of social workers. In this talk, I will discuss how the HKU STAR (Social Technology And Research) Lab uses data science technologies to support elderly and family care services.

AI-assisted Knowledge Navigation

Qui: 
Akhil ARORA
Quand: 
Monday, December 11, 2023 - 14:00 to 15:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C2

As informavores, information seeking is a key characteristic of human nature. Fueled by curiosity, humans usually navigate a plethora of real-world networks, including but not limited to the World Wide Web, online encyclopedic systems, news articles, and social networks. Consequently, the navigation patterns employed by humans provide deeper insights into how humans explore, browse, and interface with information on the Web.

More and more features in ontology-mediated query answering: the quest for optimal models!

Qui: 
Quentin MANIERE
Quand: 
Friday, October 20, 2023 - 11:00 to 12:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle de réunion 2ème étage

In this talk, I'll give a general presentation of my past and present research topics. This ranges from answering counting queries on description logic knowledge bases to dealing with inconsistent streams of data, via exploring circumscription on the guarded fragment of first-order logic. The common denominator is the addition of features to the Ontology-Mediated Query Answering framework (OMQA) for which a precise understanding of the underlying models is required.

Fair Preference Aggregation in Human-in-the-loop Systems

Qui: 
Senjuti BASU ROY
Quand: 
Thursday, July 6, 2023 - 14:00 to 15:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C5

An emerging trend is to leverage an under-explored and richly heterogeneous pool of human knowledge inside machine algorithms, a practice popularly termed as human-in-the-loop (HIL) process. A wide variety of applications, starting from query processing to text translation, feature engineering, or even human decision making in complex uncertain environments stand to benefit from such synergistic man-machine collaboration. This talk will give an overview of our ongoing research projects, recent research results, and impacts.

Effective Exploration of Graph-Structured Data

Qui: 
Madhulika MOHANTY
Quand: 
Thursday, March 16, 2023 - 11:00 to 12:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle de réunion RDC

Large Graphs such as YAGO, DBPedia, and Wikidata, form the backbone for many applications including chatbots, personal assistants and question answering systems. Graph database (GDB) users typically use structured queries to precisely express their information needs. However, given the exact match semantics of these languages, a common challenge that they face is that of getting empty or too few results. In this talk, I will discuss some solutions that enable GDB users to explore unfamiliar graphs.

Non-Functional Certification of Modern Distributed Systems

Qui: 
Claudio ARDAGNA
Quand: 
Wednesday, March 8, 2023 - 08:00 to 10:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C1

The evolution of ICT is a rapid and inexorable process that changed the society landscape several times in the last decades.

PGPregel: an End-to-End System for Privacy-Preserving Graph Processing in Geo-Distributed Data Centers

Qui: 
Amelie CHI ZHOU
Quand: 
Monday, January 9, 2023 - 13:00 to 14:00
Où: 
visio : https://univ-lyon1-fr.zoom.us/j/81130702471?pwd=N085VXBJTlI1bys1M1hOaXpOWFlIQT09

Graph processing is a popular computing model for big data analytics. Emerging big data applications are often maintained in multiple geographically distributed (geo-distributed) data centers (DCs) to provide low-latency services to global users. Graph processing in geo-distributed DCs suffers from costly inter-DC data communications. Furthermore, due to increasing privacy concerns, geo-distribution imposes diverse, strict, and often asymmetric privacy regulations that constrain geo-distributed graph processing. Existing graph processing systems fail to address these two challenges.

Knowledge Graphs and Exploration: How to Find Your Way in the Data Wilderness

Qui: 
Matteo LISSANDRINI
Quand: 
Thursday, December 15, 2022 - 12:45 to 13:45
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle TD10

Exploration is one of the primordial ways to accrue knowledge about the world and its nature. As we accumulate, mostly automatically, data at unprecedented volumes and speed, our datasets have become complex and hard to understand. In this context, exploratory methods offer the capabilities of progressively gathering the necessary knowledge when dealing with datasets that are to us "terra incognita". Yet, when dealing with complex data, we are also in need of powerful data models that give us the necessary expressivity to properly handle the richness and intricacies of the data at hand.

Modèles d’apprentissage sur les données de santé avec indicateurs de qualité

Qui: 
Donato TIANO
Quand: 
Thursday, December 8, 2022 - 09:30 to 11:30
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C5

(soutenance de thèse)

SQL in accessing and cleaning semistructured data

Qui: 
Yannis PAPAKONSTANTINOU
Quand: 
Tuesday, September 13, 2022 - 14:30 to 15:30
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle TD10

A key step in the democratization of analytics is the democratization of Extract Load Transform (ELT). Democratization depends on SQL as SQL is the most well-known, declarative language. Indeed, SQL adoption increases in areas that were not considered the traditional domain of SQL; a new class of users, often called analytics engineers, are enabled to SQL their way into areas that were previously inaccessible to them.

Centralised Graph Processing: How far can we go?

Qui: 
Jacopo URBANI
Quand: 
Friday, July 1, 2022 - 11:00 to 12:00
Où: 
visio : https://univ-lyon1-fr.zoom.us/j/82111295150?pwd=dmpheFRudk9wZ1E4QStaT3BUQkpSUT09

How to store and query very large graphs is a problem that has been attracting much interest in the database research community. Currently, the mainstream approach to improve the scalability is to use distributed computing architectures, which offer many cores and storage space. However, the benefit of getting much more computing power comes at the price of higher communication cost and increased system complexity.

Including human perspective in data-intensive applications with empathful design at scale

Qui: 
Andrea MAURI
Quand: 
Thursday, June 9, 2022 - 13:00 to 14:00
Où: 
visio https://univ-lyon1-fr.zoom.us/j/82342702622?pwd=bkNCdTY3U0hGN3ZiUmFUYldHRFRJZz09

Data is becoming more and more accessible. The proliferation of Web platforms (e.g., social media and web fora) together with the increased affordance of smart sensing technologies allowed accessing data about a large and diverse set of users, as their activities in the digital world reflect their real-life desires, drives, and needs. In the last decade(s), several computational solutions - based on data science and machine learning -- have been developed to make sense and extract useful and meaningful insights from this large amount of data.

Counting Queries over ELHI⊥ Ontologies

Qui: 
Quentin MANIERE & Michael THOMAZO
Quand: 
Thursday, June 2, 2022 - 10:00 to 12:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C5

"While ontology-mediated query answering most often adopts (unions of) conjunctive queries as the query language, some recent works have explored the use of counting queries coupled with DL-Lite ontologies. In a recent paper we extend the study of counting queries to Horn description logics outside the DL-Lite family.

Expressivity of Datalog-Based Query Languages

Qui: 
Quentin MANIERE & Michael THOMAZO
Quand: 
Thursday, June 2, 2022 - 10:00 to 12:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C5

Datalog and its extensions (such as existential rules) are widely studied querying formalism. A natural question is to characterise which queries can be expressed within such query languages, in the style of Immerman-Vardi theorem. In this talk, I will present some results regarding the expressivity of Datalog-based query languages. The last such result if that, perhaps surprisingly, any query that is decidable and closed under homomorphism is expressible by a set of existential rules for which the standard chase is universally terminating.

Provenance for knowledge graphs: data, queries, and beyond

Qui: 
Katja HOSE
Quand: 
Friday, May 20, 2022 - 13:30 to 14:30
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C4

Scalable Analysis of Temporal Property Graphs

Qui: 
Christopher ROST
Quand: 
Friday, May 13, 2022 - 13:00 to 14:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C1

Temporal property graphs are graphs whose structure and properties change over time. Temporal graph datasets tend to be

A Knowledge Revolution is coming!

Qui: 
Juan SEQUEDA
Quand: 
Wednesday, April 27, 2022 - 10:30 to 12:30
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C5

Enterprises today, large and small, are moving towards the modern data stack: a suite of data integration tools which are hosted in the cloud and require minimal technical configuration by users. This is revolutionizing the legacy ways of integrating data. A concern I have is that we will continue the same ol’ same ol’ with data, moving it between different silos and further emphasizing an application-centric world and a software wasteland, except that this time it will be in the cloud. We continue to forget an essential ingredient: knowledge!

Graph Query Languages: What Should We Study?

Qui: 
Leonid LIBKIN
Quand: 
Wednesday, April 27, 2022 - 10:30 to 12:30
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C5

For several decades the study of graph query languages has concentrated on RPQs (regular path queries) and many derivatives: CRPQ, 2RPQ, 2CRPQ, ECRPQ, RDPQ, to name a few. But do these really constitute the core of graph query languages? A quick look at Cypher and the emerging GQL and SQL/PGQ standards lead to the negative answer. But what shall we be studying then, how, and why? This talk briefly surveys the classics, outlines key features of graph languages, and suggests new formal models as well as ways to influence the new standards.

Inconsistency-aware Quantification, Query Answering and Ranking in Relational Databases

Qui: 
Ousmane ISSA
Quand: 
Monday, February 21, 2022 - 09:00 to 11:00
Où: 
visio

Soutenance de thèse

Ananke: A Streaming Framework for Live Forward Provenance

Qui: 
Dimitris PALYVOS-GIANNAS & Bastian HAVERS
Quand: 
Tuesday, November 30, 2021 - 12:45 to 13:45
Où: 
visio

Data streaming enables online monitoring of large and continuous event streams in Cyber-Physical Systems (CPSs). In such scenarios, fine-grained backward provenance tools can connect streaming query results to the source data producing them, allowing analysts to study the dependency/causality of CPS events. While CPS monitoring commonly produces many events, backward provenance does not help prioritize event inspection since it does not specify if an event's provenance could still contribute to future results.

Towards declarative comparabilities: application to functional dependencies

Qui: 
Simon VILMIN
Quand: 
Wednesday, July 7, 2021 - 13:00 to 14:00
Où: 
visio

In data managment, deciding that two values are equal is a problem more complex and more subtle than it seems. In fact, only domain experts can define the meaning of 'equality' on their data. However, declarative frameworks with which experts can specify their definition of equality at a high level of abstraction are missing. In this talk, we introduce a lattice-based framework to cope with this issue. For each attribute of the relation scheme, we give a comparability function mapping every pair of the attribute's domain to a value in a similarity scale ordered as a

Any-k: Optimal Join Algorithms meet Top-k

Qui: 
Nikos TZIAVELIS
Quand: 
Tuesday, June 29, 2021 - 12:45 to 13:45
Où: 
visio

Top-k queries have been studied intensively in the database community and they are an important means to reduce query cost when only the “best” or “most interesting” results are needed instead of the full output. However, optimality results for queries involving joins hold only in a fairly limited model of computation that does not account for the cost incurred by large intermediate results.

Data and ML for Data Prep for ML: The ML Data Prep Zoo

Qui: 
Arun KUMAR
Quand: 
Tuesday, April 27, 2021 - 17:00 to 18:00
Où: 
visio

There is growing demand in the enterprise, Web, sciences, healthcare, and other domains for tools that make it easier to adopt machine learning (ML) for data analytics. In response, "ML platforms," including automated ML (AutoML) platforms, have emerged to systematize and even automate the whole ML workflow. Examples include SalesForce's Einstein, Google's Tensorflow Extended, and Amazon's AutoGluon. Such tools obviate or reduce manual grunt work for data preparation (prep), feature engineering, and/or model building.

Algebraic Amplification for Semi-Supervised Learning from Sparse Data

Qui: 
Wolfgang GATTERBAUER
Quand: 
Thursday, March 11, 2021 - 11:00 to 12:00
Où: 
visio

Node classification is an important problem in graph data management. It is commonly solved by various label propagation methods that work iteratively starting from a few labeled seed nodes. For graphs with arbitrary compatibilities between classes, these methods crucially depend on knowing the compatibility matrix that must be provided by either domain experts or heuristics. Can we instead directly estimate the correct compatibilities from a sparsely labeled graph in a principled and scalable way?

Towards Efficient Execution of Data Science Pipelines

Qui: 
Javier A. ESPINOSA OVIEDO
Quand: 
Thursday, February 25, 2021 - 12:45
Où: 
visio

The democratization of powerful computing architectures (cloud computing, GPUs, TPUs), together with advances in machine and deep learning methods, are seen as a promise for getting insight from big datasets and powering AI data-centric solutions. In this context, data scientists are responsible for defining complex and repetitive operations called “data science pipelines” intended to extract value (or produce a model) from these datasets.

From Velocity on the Web to Velocity Everywhere

Qui: 
Riccardo TOMMASINI
Quand: 
Tuesday, February 9, 2021 - 12:45 to 13:45
Où: 
visio

The distributed nature of Web applications is one of the reasons for the popularity of the Web.

Three-dimensional Entity Resolution (with JedAI)

Qui: 
George PAPADAKIS
Quand: 
Friday, June 26, 2020 - 12:45 to 13:45
Où: 
visio

Entity Resolution (ER) is the task of detecting different entity descriptions that pertain to the same real-world objects. In this talk, we delve into the main end-to-end workflows that tackle it in an efficient and effective way, scaling to large volumes of structured or semi-structured data. First, we describe the two main flavors of batch (i.e., budget-agnostic) Entity Resolution: the one based on a series of schema-agnostic blocking and block processing (i.e., meta-blocking) methods and the one based on string similarity join techniques.

Scalable Machine Learning on Large Sequence Collections

Qui: 
Themis PALPANAS
Quand: 
Friday, June 5, 2020 - 12:45 to 13:45
Où: 
visio

There is an increasingly pressing need, by several applications in diverse domains, for developing techniques able to analyze very large collections of sequences, or data series. Examples of such applications come from astrophysics and a multitude of other scientific and application domains that need to apply machine learning techniques for knowledge extraction. It is not unusual for these applications to involve numbers of data series in the order of hundreds of millions to billions, which are often times not analyzed in their full detail due to their sheer size.

The Role of Data Management in Studying Fairness

Qui: 
Sihem AMER-YAHIA
Quand: 
Friday, May 15, 2020 - 12:45 to 14:00
Où: 
visio https://meet.jit.si/Réunion_équipe_BD_15Mai2020

Fairness is a heavily studied topic in Machine Learning. The purpose of this talk is to survey prominent work on fairness and argue for the need for a data management approach. I will illustrate that with a recent study we did in the context of TaskRabbit and Google job search, two online job marketplaces. A data management framework would enable a variety of queries such as finding the k least/most discriminated against groups/jobs/locations. The large number of groups, queries and locations calls for using efficient algorithms.

Software Heritage: Analyzing the Global Graph of Public Software Development

Qui: 
Stefano ZACCHIROLI
Quand: 
Friday, February 7, 2020 - 12:45 to 14:00
Où: 
Insa-Lyon, bât. B.Pascal, salle de réunion du département IF

The Software Heritage project has assembled the largest existing archive of publicly available software source code and associated development history, for more than 6 billion unique source code files and 1 billion unique commits, coming from more than 90 million software development projects.

Designing and enacting data science pipelines as queries

Qui: 
Genoveva VARGAS-SOLAR
Quand: 
Thursday, February 6, 2020 - 12:45 to 14:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C2

Since the emergence of the 5V’s (i.e., n-V’s) models describing non-functional properties of data, new visions of querying have emerged. Batch, on-demand queries, with expected complete and sound results, have evolved into complex data science pipelines combining processing and analytics tasks. Similar to a query, described as a data flow, a data science pipeline is a combination of tasks. Different to classic queries that rely on well-defined data structures with associated operators.

Pattern Matching in Massive Graphs with Precision and Recall Guarantees

Qui: 
Matei RIPEANU
Quand: 
Friday, January 24, 2020 - 12:30 to 13:30
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C2

Pattern matching in graphs, that is, finding subgraphs that match a smaller template graph within a large background graph, is fundamental to graph analysis and serves a rich set of applications. Unfortunately, existing solutions have limited scalability, are difficult to parallelize, and/or support only a limited set of search patterns.

We explore avenues towards a scalable solution for pattern matching. We target practical pattern matching scenarios in large-scale property graphs, able to operate on massive distributed memory machines.

Soutenance de thèse : Recherche d'information agrégative dans les bases de graphes distribuées

Qui: 
Rihab AYED
Quand: 
Monday, December 16, 2019 - 09:45 to 11:45
Où: 
Université Lyon1, Bât. Darwin, salle Fontannes

Le sujet de cette thèse s’inscrit dans le cadre général de la Recherche d’Information et la gestion des données distribuées. Notre problématique concerne l’évaluation et l’optimisation de requêtes agrégatives (Aggregated Search). La Recherche d’Information Agrégative (RIA) est un nouveau paradigme permettant l’accès à l’information massivement distribuée. Elle a pour but de retourner à l’utilisateur d’un système de recherche d’information des objets résultats qui sont riches et porteurs de connaissances. Ces objets n’existent pas en tant que tels dans les sources.

Soutenance de thèse : Exceptional Model Mining for Behavioral Data Analysis

Qui: 
Adnene BELFODIL
Quand: 
Thursday, October 24, 2019 - 14:00 to 16:00
Où: 
Insa-Lyon, bât. B.Pascal, salle de réunion du Liris

(Titre Fr. Fouille de Modèles Exceptionnels dans les Données Comportementales)

Soutenance de thèse : An Order Theoritic Point-of-view on Subgroup Discovery

Qui: 
Aimene Belfodil
Quand: 
Monday, September 30, 2019 - 14:00 to 16:00
Où: 
Insa-Lyon, bât. B.Pascal, salle de réunion du Liris

Comme le titre pourrait le suggérer, l’objectif principal de cette thèse est de fournir une meilleure compréhension de la tâche de la découverte de sous-groupes à travers la théorie de l’ordre. La découverte de sous-groupes (Subgroup Discovery - SD) est la tâche automatique dont le but est la découverte d’hypothèses intéressantes dans les bases de données.

DEvIANT: Discovering Significant Exceptional (Dis-)Agreement Within Groups

Qui: 
Adnene BELFODIL
Quand: 
Tuesday, September 10, 2019 - 16:00 to 17:00
Où: 
Insa-Lyon, bât. B.Pascal, salle de réunion du Liris

We strive to find contexts (i.e., subgroups of entities) under which exceptional (dis-)agreement occurs among a group of individuals, in any type of data featuring individuals (e.g., parliamentarians, customers) performing observable actions (e.g., votes, ratings) on entities (e.g., legislative procedures, movies). To this end, we introduce the problem of discovering statistically significant exceptional contextual intra-group agreement patterns. To handle the sparsity inherent to voting and rating data, we use Krippendorff’s Alpha measure for assessing the agreement among individuals.

Relaxed Functional Dependencies: Definition and Discovery from Big Data

Qui: 
Loredana CARUCCIO
Quand: 
Friday, August 30, 2019 - 12:45 to 13:45
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle de réunion 2ème étage

Functional dependencies (FDs) are potentially useful to assess data quality. However, in order to identify data inconsistencies, patterns of semantically related data, and pursue robustness with respect to data errors, it has been necessary to devise approximate versions of functional dependencies, yielding relaxed functional dependencies (RFDs) [1]. The latter can be classified into three categories, depending on the constraint they relax with respect to the canonical definition of FD.

AI for Data Quality: Automating Data Science Pipelines

Qui: 
Ihab ILYAS
Quand: 
Thursday, July 11, 2019 - 15:00 to 16:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C2

Data scientists spend big chunk of their time preparing, cleaning, and transforming raw data before getting the chance to feed this data to their well-crafted models. Despite the efforts to build robust predication and classification models, data errors still the main reason for having low quality results. This massive labor-intensive exercises to clean data remain the main impediment to automatic end-to-end AI pipeline for data science.

Thinking and Building together a Sustainable City

Qui: 
John SAMUEL
Quand: 
Friday, January 25, 2019 - 12:45 to 13:45
Où: 
Insa-Lyon, bât. B.Pascal, salle de réunion du Liris

Cities have played a significant role in the development of a country. People from diverse backgrounds and expertise come together and contribute towards building a unique identity of a city. Nevertheless, lessons from the development of cities cannot be ignored since they not only help to preserve the identity of a city but also serve as guiding principles to solve the future challenges of building sustainable and durable cities in other regions.

Soutenance de thèse : Migration et Enrichissement Sémantique d'Entités Culturelles

Qui: 
Joffrey DECOURSELLE
Quand: 
Friday, September 28, 2018 - 10:00 to 12:00
Où: 
Université Lyon1, Bât. Darwin, salle Fontannes

Les technologies du Web Sémantique offrent de nouvelles possibilités pour améliorer les services dédiés à la diffusion des connaissances culturelles et intellectuelles. Cependant, de nombreuses institutions, en charge de fonds documentaires, doivent gérer leurs catalogues selon des normes héritées des années 60. Le paradigme historique des notices papier, où chaque notice décrit un document possédé par une institution, est encore majoritairement utilisé par la communauté documentaire.

Query-based Linked Data Anonymization

Qui: 
Rémy DELANAUX
Quand: 
Thursday, September 27, 2018 - 12:45 to 13:45
Où: 
Insa-Lyon, bât. B.Pascal, salle de réunion du Liris

While data anonymization has been a well-explored field for several decades, and Semantic Web technologies and standards being more and more used by institutions and organizations for modeling Linked Open Data, privacy-preserving data publishing is still obscure on this field. It appears important to define such a framework, notably using Semantic Web standards such as RDF graphs and triples, or SPARQL queries.

Migration et Enrichissement Sémantique d'Entités Culturelles

Qui: 
Joffrey DECOURSELLE
Quand: 
Monday, September 24, 2018 - 13:00 to 14:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C1

Les technologies du Web Sémantique offrent de nouvelles possibilités pour améliorer les services dédiés à la diffusion des connaissances culturelles et intellectuelles. Cependant, de nombreuses institutions, en charge de fonds documentaires, doivent gérer leurs catalogues selon des normes héritées des années 60. Le paradigme historique des notices papier, où chaque notice décrit un document possédé par une institution, est encore majoritairement utilisé par la communauté documentaire.

Extraction d’informations sémantiques à partir de textes pour l’interprétation du contexte spatial

Qui: 
Ludovic MONCLA
Quand: 
Friday, September 21, 2018 - 12:45 to 13:45
Où: 
Insa-Lyon, bât. B.Pascal, salle de réunion du Liris

Lors de ce séminaire je présenterai mes travaux de recherche autour de l’extraction d’informations géographiques et je détaillerai les différents projets auxquels j’ai contribué. Je présenterai en particulier la plateforme PERDIDO qui implémente une méthode d’extraction d’informations géographiques. Cette méthode, basée sur une approche TAL hybride, combine une analyse morphosyntaxique, une cascade de transducteurs (implémentant des grammaires de construction), l’interrogation de ressources du Web des données (Linked Data) et la visualisation des informations géographiques.

Point sur la plateforme ExpeData

Qui: 
Emmanuel COQUERY
Quand: 
Friday, September 14, 2018 - 12:45 to 13:45
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C1

Anytime Subgroup Discovery in Numerical Domains with Guarantees

Qui: 
Adnene BELFODIL
Quand: 
Friday, September 7, 2018 - 12:45 to 13:45
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C1

Subgroup discovery is the task of discovering patterns that accurately discriminate a class label from the others. Existing approaches can uncover such patterns either through an exhaustive or an approximate exploration of the pattern search space. However, an exhaustive exploration is generally unfeasible whereas approximate approaches do not provide guarantees bounding the error of the best pattern quality nor the exploration progression (“How far are we of an exhaustive search”). We design here an algorithm for mining numerical data with three key properties w.r.t.

Point sur la plateforme ExpeData (suite)

Qui: 
Emmanuel COQUERY
Quand: 
Friday, July 6, 2018 - 12:45 to 13:45
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle TD9

Retour sur le travail fait sur la plateforme ExpeData:

  • expérimentation HelloWorld et bonnes pratiques expérimentales
  • Stream Management System

Point sur la plateforme ExpeData

Qui: 
Emmanuel COQUERY
Quand: 
Friday, June 22, 2018 - 12:45 to 13:45
Où: 
Nautibus, salle TD9

Retour sur le travail fait sur la plateforme ExpeData:

  • expérimentation HelloWorld et bonnes pratiques expérimentales
  • Stream Management System

Distributed query processing over fluctuating data streams

Qui: 
Roland KOTTO KOMBI
Quand: 
Friday, June 15, 2018 - 12:45 to 13:45
Où: 
B.Pascal salle de réunion du Liris

Le traitement de flux de données est au cœur des problématiques actuelles liées au Big Data. Face à de grandes quantités de données (Volume) accessibles de manière éphémère (Vélocité), des solutions spécifiques tels que les systèmes de gestion de flux de données (SGFD) ont été développés. Ces SGFD reçoivent des flux et des requêtes continues pour générer de nouveaux résultats aussi longtemps que des données arrivent en entrée.

Industrie 4.0 : concept, opportunité et challenges

Qui: 
Armand BABOLI
Quand: 
Friday, June 8, 2018 - 12:45 to 13:45
Où: 
Nautibus, salle TD9

Le contexte fortement concurrentiel du marché mondial impose les entreprises vers la mise en place de systèmes de production beaucoup plus flexibles et réactifs, dont le Système Manufacturier Connecté. L’évolution dans la technologie d’informatique et de télécommunication nous apporte des très grandes facilités pour la mise en place de ce système. De ce fait, on parle également de quatrième révolution industriel, nommé, selon les pays, Industrie 4.0, Intelligent Manufacturing Systems (IMS), Cyber-Physical Systems (CPS), usine intelligente (smart factory), etc.

Interactive Mapping Specification with Exemplar Tuples

Qui: 
Ugo COMIGNANI
Quand: 
Friday, May 4, 2018 - 12:45 to 13:45
Où: 
B.Pascal salle de réunion du Liris

While schema mapping specification is a cumbersome task for data curation specialists, it becomes unfeasible for non-expert users, who are unacquainted with the semantics and languages of the involved transformations.

Potential of Computational Intelligence in Modern Data Management

Qui: 
Allel HADJALI
Quand: 
Friday, April 27, 2018 - 12:45 to 13:45
Où: 
Nautibus, salle TD9

Data is becoming an increasingly decisive resource in modern complex real-world applications in different domains (such as Scientific Experimentations/Observations, Transport, Energy, Surveillance, Climate and Weather, Healthcare, Social Media, etc.). Modern data is data whose scale, diversity and complexity require new approaches, algorithms and analytics to manage and exploit it.

Could Functional Dependencies Help to Identify Balanced Classification Datasets ?

Qui: 
Marie LE GUILLY
Quand: 
Friday, April 6, 2018 - 12:45 to 13:45
Où: 
B.Pascal salle de réunion du Liris

When using machine learning algorithms to solve classification problems, one recurring problem is the one of unbalanced datasets, especially in binary classification when one class is much bigger than the other. Several solutions have been proposed to tackle the problem, such as undersampling of the majority class. This undersampling approach is generally based on statistical on the data. We propose a different approach to this problem, by considering the functional dependencies and their interactions in the two classes.

Système de recommandations : généricité, évaluation et améliorations

Qui: 
Elsa NEGRE
Quand: 
Thursday, April 5, 2018 - 12:45 to 13:45
Où: 
B.Pascal salle de réunion du Liris

Nos travaux s'articulent autour de l'extraction et de l'analyse de données issues de sources hétérogènes pour les rendre facilement accessibles et exploitables par les utilisateurs/décideurs. En effet, il devient de plus en plus difficile de savoir quelles sont les données à rechercher et où les trouver lorsque la masse de données/informations s'accroît. Des techniques informatiques existent pour faciliter cette recherche et permettre une extraction pertinente des données/informations.

Graph Construction in Composable Graph Query Languages

Qui: 
Hannes VOIGT
Quand: 
Thursday, February 22, 2018 - 14:00 to 15:30
Où: 
Nautibus, salle C2

In today’s area of Big Data, data is collected to a large extent automatically by hard- and software sensors in fine granularity and low abstraction. Where users interact with data, e.g. for data analytics, they typically think, reason, and talk about entities of larger granularity and higher abstraction. For instance, a graph of twitter communication contains individual messages, retweet relationships, etc. while social network analysis done on such data is interested in discussions, topics, communities and so on.

Decentralized Data Management for the Semantic Web

Qui: 
Hala SKAF
Quand: 
Friday, February 2, 2018 - 12:45 to 13:45
Où: 
Nautibus, salle TD9

The semantic web is an extension of the web where information has a precise meaning. Thousands of linked datasets are available on the web. Important problems concerning quality, deep web access and availability still unsolved. For data quality, we propose to transform the web of data into a read/write web of data. A data consumer will able to correct an error. Allowing consumers to write the semantic web poses the problem of data consistency. We define synchronization algorithms for RDF data model.

Valorisation de production logicielle Liris-BD et reproductibilité d'expérimentations

Qui: 
Philippe LAMARRE et Emmanuel Coquery
Quand: 
Friday, January 26, 2018 - 12:45 to 13:45
Où: 
B.Pascal salle de réunion du Liris
  1. Réflexions sur la valorisation de la production logicielle Liris-BD
  2. Poursuite des réflexions sur la reproductibilité d'expérimentations

Webinar : Controling your environment

Quand: 
Friday, January 19, 2018 - 12:45 to 13:45
Où: 
Nautibus, salle TD9

Ce webinar (diffusé à l’origine le 5/4/2016) fait partie d’une série autour de la recherche reproductible (voir aussi le séminaire LIRIS du jeudi 9/11/2017). On y parle des difficulté et de quelques solutions autour du contrôle de l’environnement d’expérimentation.

Voir https://github.com/alegrand/RR_webinars/blob/master/2_controling_your_en...

SQL query completion for data exploration

Qui: 
Marie LE GUILLY
Quand: 
Friday, December 22, 2017 - 12:45 to 13:45
Où: 
Nautibus, salle TD9

Within the big data tsunami, relational databases and SQL are still there and remain mandatory in most of cases for accessing data. On the one hand, SQL is easy-to-use by non specialists and allows to identify pertinent initial data at the very beginning of the data exploration process. On the other hand, it is not always so easy to formulate SQL queries: nowadays, it is more and more frequent to have several databases available for one application domain, some of them with hundreds of tables and/or attributes.

Database Learning

Qui: 
Michael​ MATHIOUDAKIS
Quand: 
Friday, December 15, 2017 - 12:45 to 13:45
Où: 
B.Pascal salle de réunion du Liris

The talk will discuss 'Database Learning', an ongoing effort to blend machine learning techniques with query processing in database systems. We will describe existing work in the area and possible directions of future work.

Flashpoints: Discovering Exceptional Pairwise Behavior in Vote or Rating Datasets

Qui: 
Adnene BELFODIL
Quand: 
Friday, October 27, 2017 - 12:45 to 13:45
Où: 
Nautibus, salle TD9

We address the problem of discovering contexts that lead well-distinguished collections of individuals to change their pairwise agreement w.r.t. to their usual one. For instance, in the European parliament, while in overall, a strong disagreement is witnessed between deputies of the far-right French party Front National and deputies of the left party Front de Gauche, a strong agreement is observed between these deputies in votes related to the thematic: External relations with the union.

Magic and Other Tricks for Goal-Driven Query Answering

Qui: 
Efthymia TSAMOURA
Quand: 
Friday, October 20, 2017 - 13:00 to 13:45
Où: 
Nautibus, salle C4

Speaker: Efthymia Tsamoura, Alan Turing Institute and Oxford University, UK

Approche déclarative pour le stockage à long terme de données capteurs

Qui: 
Manel CHARFI
Quand: 
Friday, September 15, 2017 - 14:00 to 15:00
Où: 
Nautibus, salle TD2

(répétition avant soutenance de thèse)

De nos jours, on a de plus en plus de capteurs qui ont tendance à apporter confort et facilité dans notre vie quotidienne. Ces capteurs sont faciles à déployer et à intégrer dans une variété d’applications (monitoring de bâtiments intelligents, aide à la personne,...). Ces milliers (voire millions)de capteurs sont de plus en plus envahissants et génèrent sans arrêt des masses énormes de données qu’on doit stocker et gérer pour le bon fonctionnement des applications qui en dépendent.

Soutenance de thèse « Intégration des données hétérogènes issues de plusieurs fournisseurs de services géo-localisés : un cas d'utilisation sur les points d'intérêt touristique »

Qui: 
Bilal BERJAWI
Quand: 
Friday, September 1, 2017 - 14:00 to 16:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

Les services de géolocalisation (LBS) sont impliqués dans de nombreuses applications pour fournir des informations géospatiales pertinentes basées sur une position ou une adresse géographique. La quantité de données géospatiales disponible augmente constamment et constitue des sources d'informations précieuses pour enrichir les applications LBS. Cependant, ces données géospatiales sont souvent incohérentes et contradictoires d'une source à l'autre. Aussi, pensons-nous que l'intégration de données géospatiales à partir de plusieurs sources peut améliorer la qualité de l'information offerte aux utilisateurs.

Dans cette thèse, nous nous intéresserons plus spécifiquement aux données représentant les points d'intérêt (POIs) que les touristes peuvent obtenir grâce à des applications LBS. Techniquement, un POI est représenté par une entité géospatiale qui décrit ses informations terminologiques et spatiales. La récupération, l'alignement et la fusion de ces entités géospatiales mènent à plusieurs défis. Nous nous focalisons principalement sur trois principaux défis : (i) traiter les différents schémas et structures des entités, (ii) détecter et fusionner les entités correspondantes issues de multiples sources et (iii) tenir compte de l'incertitude liée aux entités intégrées et proposer leur représentation dans les applications LBS.

A Preventive Auto-Parallelization Approach for Elastic Stream Processing

Qui: 
Roland KOTTO KOMBI
Quand: 
Friday, June 2, 2017 - 14:00 to 15:00
Où: 
B.Pascal salle de réunion du Liris

Nowadays, more and more sources (connected devices,social networks, etc.) emit real-time data with fluctuating rates over time. Existing distributed stream processing engines (SPE) have to resolve a difficult problem: deliver results satisfying end-users in terms of quality and latency without over-consuming resources. This paper focuses on parallelization of operators to adapt their throughput to their input rate. We suggest an approach which prevents operator congestion in order to limit degradation of results quality.

Modélisation NoSQL des entrepôts des données multidimensionnelles massives

Qui: 
Mohammed EL MALKI
Quand: 
Friday, May 5, 2017 - 14:00 to 15:00
Où: 
B.Pascal salle de réunion du Liris

Les systèmes d’aide à la décision occupent une place prépondérante au sein des entreprises et des grandes organisations, pour permettre des analyses dédiées à la prise de décisions. Avec l’avènement du big data, le volume des données d’analyses atteint des tailles critiques, défiant les approches classiques d’entreposage de données, dont les solutions actuelles reposent principalement sur des bases de données R-OLAP.

OLAP multifonctions et OLAP spatiale

Qui: 
Ali HASSAN
Quand: 
Friday, April 7, 2017 - 14:00 to 15:00
Où: 
B.Pascal salle de réunion du Liris

Le séminaire s’articule sur deux points principaux : - Bases de données multidimensionnelles et OLAP multifonctions - Affichages cartographiques SOLAP adaptifs

Challenges in Making the Semantic Web Formalisms and Technologies Accessible to the Web of Things

Qui: 
Maxime LEFRANCOIS
Quand: 
Friday, March 31, 2017 - 14:00 to 15:00
Où: 
Nautibus, salle TD2

Semantic interoperability is said to be the enabler for 40-60% of the global economic impact of the Internet of Things at the horizon 2025. In this talk I propose an overview of some of the main scientific problems that need to be solved to reach this goal, along with some of my research and standardization contributions. 1. how to make the Things able to securely interact on the Web in conformance with its architecture principles, and the REST architectural design principles?

Query-driven Data Completeness Assessment

Qui: 
Simon RAZNIEWSKI
Quand: 
Friday, February 17, 2017 - 14:00 to 15:00
Où: 
Nautibus, salle C2

In many applications including loosely coupled cloud databases, collaborative editing and network monitoring, data from multiple sources is regularly used for query answering. For reasons such as system failures, insufficient author knowledge or network issues, data may be temporarily unavailable or generally nonexistent. Hence, not all data needed for query answering may be available. In this talk, I will give an overview techniques for reasoning about data completeness.

Energy Enhancement of Multi-Application Monitoring Systems for Smart Buildings

Qui: 
Ozgun PINARER
Quand: 
Friday, February 10, 2017 - 14:00 to 15:00
Où: 
B.Pascal salle de réunion du Liris

Recent researches and analysis reports declare that high energy consumption of buildings is major problem in developed countries. As a result, they show concretely that building energy management systems (BEMS) and deployed wireless sensor network environments are important for energy efficiency of building operations. In the literature, existing smart building management systems focus on energy consumption of the building, hardware deployed inside/outside of the building and network communication issues.

Soutenance de Thèse : QTor, une approche communautaire pour l'évaluation de requêtes continues

Qui: 
Sébastien DUFROMENTEL
Quand: 
Friday, December 9, 2016 - 14:00 to 16:00
Où: 
B.Pascal salle de réunion du Liris

Cette thèse porte sur la mise en place d'un système de requêtage sur des flux sous contraintes de capacités. Ce système est porté par ses utilisateurs⋅trices et basé sur les similitudes entre requêtes. Les relations d'équivalences entre les différentes requêtes permettent de réunir les participants au sein de communautés d'intérêt. Celles-ci forment alors une abstraction permettant de séparer le problème d'organisation du système en plusieurs sous-problèmes plus simples et de taille réduite.

QTor, une approche communautaire pour l'évaluation de requêtes continues

Qui: 
Sébastien DUFROMENTEL
Quand: 
Friday, December 2, 2016 - 14:00 to 15:00
Où: 
B.Pascal salle de réunion du Liris

Répétition avant soutenance de thèse : Cette thèse porte sur la mise en place d'un système de requêtage sur des flux sous contraintes de capacités. Ce système est porté par ses utilisateurs⋅trices et basé sur les similitudes entre requêtes. Les relations d'équivalences entre les différentes requêtes permettent de réunir les participants au sein de communautés d'intérêt. Celles-ci forment alors une abstraction permettant de séparer le problème d'organisation du système en plusieurs sous-problèmes plus simples et de taille réduite.

Formalizing and Studying Dialectical Explanations in Inconsistent Knowledge Bases

Qui: 
Abdallah ARIOUA
Quand: 
Tuesday, October 11, 2016 - 13:00 to 14:00
Où: 
Nautibus, salle C5

Knowledge bases are deductive databases where the machinery of logicis used to represent domain-specific and general-purpose knowledge over existing data. In the existential rules framework, a knowledge base is composedof two layers: the data layer which represents the factual knowledge, and the ontological layer that incorporates rules of deduction and negative constraints. The main reasoning service in such framework is answering queries over the data layer by means of the ontological layer. As in classical logic, contradictions trivialize query answering since everything follows

Providing Harmony between Semantic World and Stream Processing

Qui: 
Syed GILLANI
Quand: 
Thursday, June 30, 2016 - 14:00 to 15:00
Où: 
Nautibus, salle C5

In many applications, such as social networks, production lines or stock analysis, its is quite essential to create and process large amount of data at high rates. Such continuous and unbounded flow of data is abstracted under the concept of data streams, and data items within such streams are generally called as events. Traditional Data stream processing techniques -- that are based on the relational models -- deal with a wide variety of applications, however, heterogeneity among the data sources makes it difficult to provide a generalised solution.

Dialectical Explanations for Query Answering in Inconsistent Datalog+/- Knowledge Bases

Qui: 
Abdallah ARIOUA
Quand: 
Thursday, June 30, 2016 - 10:00 to 11:00
Où: 
Nautibus, salle C4

We consider the setting of Ontology-Based Data Access (OBDA) where different and possibly inconsistent data sources are wrapped by an ontological layer. The ontology and the data (a.k.a the knowledge base) are represented within the family of ontology languages Datalog+/-. Inconsistency-tolerant approaches such as the consistent query answering (CQA) semantics use different repairing strategies making query answering unintelligible and not straightforward to the end-user.

Uniformly Accessing Online Datasets

Qui: 
Maria KOUTRAKI
Quand: 
Tuesday, June 21, 2016 - 13:00 to 14:00
Où: 
Nautibus, salle C5

One of the core visions of the Semantic Web is that data can be shared across the boundaries of applications and websites. A particular application of Semantic Web is Linked Data, which publishes data as Web Data in RDF format. It enables sharing and accessing data in a decentralised manner. This is has led to the rise of many Linked Data initiatives, with its most successful project Linked Open Data (LOD), which at this time numbers thousands of datasets, and with a magnitude of billions of triples.

The Analysis and Co-design of Weakly-Consistent Applications

Qui: 
Mahsa NAJAFZADEH
Quand: 
Monday, June 20, 2016 - 14:00 to 15:00
Où: 
Nautibus, salle C3

Distributed databases take advantage of replication to bring data close to the client, and to always be available. The primary challenge for such databases is to ensure consistency. The inherent trade-off between consistency, performance, and availability represents a fundamental issue in design of the replicated database serving applications with integrity rules. Recent research provide hybrid consistency models that allow the database supports asynchronous updates by default, but synchronisation is available upon request.

Tunable Workload Generation for Graph Databases

Qui: 
George FLETCHER
Quand: 
Thursday, June 2, 2016 - 13:00 to 14:00
Où: 
B.Pascal salle du Liris

Massive graph data sets are pervasive in contemporary application domains. Hence, graph database systems are becoming increasingly important. In the study of these systems, it is vital that the research community has shared benchmarking solutions for the generation of database instances and query workloads having predictable and controllable properties. Similarly to TPC benchmarks for relational databases, benchmarks for graph databases have been important drivers for the Semantic Web and graph data management communities.

Data: Who's in Control?

Qui: 
Aurélien FARAVELON
Quand: 
Tuesday, May 17, 2016 - 13:00 to 14:00
Où: 
B.Pascal salle du Liris

Over the last years, the intemediaires - Google in the field of web search, Facebook in social relations, etc. - have grown tremendously. They are so important nowadays that some of them challenge governements when it comes to defining the level of protection of data or their modes of access.

Big Data: The New Era of Multi-Dimensional Data Management

Qui: 
Verena KANTERE
Quand: 
Monday, May 2, 2016 - 13:00 to 14:00
Où: 
Nautibus, salle C3

Ubiquitous computing and modern data collection tools have given rise to a new era of data management, in which the data as well as the processing environments are enormous and diverse. In this era in which the terms 'Big Data' and 'Cloud Computing' prevail, the success of data management relies in optimizing data processing on multiple dimensions and delivering data services with multifarious quality guarantees. This talk discusses the challenges and the opportunities of the new era of data management and explores the possibilities and limitations of multi-dimensional data management.

Optimisation de la gestion de masses de données dans les nuages informatiques

Qui: 
Laurent D'ORAZIO
Quand: 
Tuesday, April 26, 2016 - 13:00 to 14:00
Où: 
Nautibus, salle C4

L'informatique en nuages permet de faire face aux besoins de nombreux domaines d’applications scientifiques (séquençage du génome, physique corpusculaire par exemple), économiques (commerce en ligne, informatique décisionnelle, ou encore processus métiers) ou sociétaux (santé, réseaux sociaux, enseignement, etc.), au coeur desquels, les données jouent un rôle crucial.

SQL query rewriting for data exploration

Qui: 
Sabina SURDU
Quand: 
Tuesday, March 22, 2016 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du LIRIS 501.301

In a large number of domains, ranging from astrophysics to earth observation, data analysts are facing a data deluge. In this Big Data era, it is essential to explore the data in order to unearth new knowledge. As user profiles are becoming more and more diverse and data ever more complex, this task has become increasingly hard. Analysts can access gigantic scientific data through SQL, while also using data mining tools to peer their data. We propose a query rewriting technique to help data analysts formulate their queries, in order to rapidly and intuitively explore their Big Data.

Enrichissement de dimensions dans un schéma multidimensionnel en constellation

Qui: 
Lucile SAUTOT
Quand: 
Tuesday, March 8, 2016 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du LIRIS 501.301

Les entrepôts de données (DW) et les systèmes OLAP sont des technologies permettant l’analyse en ligne de grands volumes de données. Les données entreposées sont organisées selon un modèle multidimensionnel qui définit les concepts de dimensions et de faits. Les dimensions représentent les axes d’analyse, qui sont organisés en hiérarchies, tandis que les faits, qui sont les sujets d’analyse, sont décrits par des indicateurs numériques appelés mesures.

Approche formelle de la sécurité des données personnelles

Qui: 
Pablo RAUZY
Quand: 
Tuesday, March 1, 2016 - 13:00 to 14:00
Où: 
Université Lyon1, Dép. Informatique, Bât. Nautibus, salle C5

Dans le cadre d'une candidature au poste MC ECL-LIRIS : Je présenterai rapidement mes travaux de thèse sur la sécurité des implémentations cryptographiques face aux attaques physiques, puis je parlerai de ce que le fais en post-doc autour de la notion de "privacy as control". Je finirai par donner un aperçu de ce que j'aimerais faire par la suite dans le cadre de la protection des données personnelles, pour ouvrir la discussion et voir si des intérêts sur ce sujet convergent avec les membres de l'équipe.

Category Theory 101, Graph Transformation and Social Data anonymisation

Qui: 
Frédéric PROST
Quand: 
Tuesday, February 16, 2016 - 13:00 to 14:00
Où: 
Nautibus, salle C5

We will briefly introduce the basics of category theory in order to have a self-contained talk on Graph Transformation and an application to social data anonymisation.

Data Polishing; An Approach to Clarify the Structures in Data

Qui: 
Takeaki UNO
Quand: 
Tuesday, February 9, 2016 - 13:00 to 14:00
Où: 
B.Pascal salle du Liris

Data mining, particularly pattern mining and cluster mining, aims to find interesting and characteristic local structures in data with enumerational approaches, not to miss important ones. However, a big difficulty is on the huge number of solutions so that we can not identify which solutions are really important. This difficulty is a great barrier on the use of pattern mining and cluster mining in practice. In this talk, we propose a new approach called "data polishing" that takes an approach totally different from existing approaches.

|| Prototypage rapide d'entrepôt de données intégrant la fouille de données

Qui: 
Lucile SAUTOT
Quand: 
Tuesday, December 8, 2015 - 13:00 to 14:00
Où: 
B.Pascal salle du Liris

Les formalismes utilisés par les méthodes classiques de conception d’un entrepôt de données sont souvent inconnus des futurs utilisateurs, qui n’ont généralement pas de connaissances approfondies en système d’information ou en système OLAP. Ainsi, ces utilisateurs peuvent trouver difficile d’exprimer leurs besoins analytiques en termes de mesures et de dimensions sur un schéma conceptuel, c’est à dire, sans visualiser les résultats possibles de requêtes OLAP.

Traitement parallèle et déclaratif des requêtes sur des masses de données issues d'observations astronomiques

Qui: 
Amin MESMOUDI
Quand: 
Tuesday, December 1, 2015 - 13:00 to 14:00
Où: 
Nautibus, salle C1

Répétition avant soutenance de thèse

Échantillonnage de données : contextes d’application et solutions

Qui: 
Thomas CERQUEUS
Quand: 
Tuesday, November 3, 2015 - 13:00 to 14:00
Où: 
Nautibus, salle C5

Les techniques d'échantillonnage de données ont pour objectif de réduire le volume d’un ensemble de données ; il peut s’agir du contenu d’une base de données relationnelle ou du contenu d’un flux de données quelconque. L’objectif final de l’échantillonnage est de limiter les ressources nécessaires au traitement de ces données : temps d’exécution d’une tâche, capacité des machines de calcul, etc. Cet exposé présente deux exemples concrets pour lesquels l'échantillonnage s’avère intéressant, puis focalise sur une nouvelle méthode d'échantillonnage.

QTor: A Flexible Publish/Subscribe Peer-to-Peer Organization Based on Query Rewriting

Qui: 
Sébastien DUFROMENTEL
Quand: 
Tuesday, October 6, 2015 - 13:00 to 14:00
Où: 
Nautibus, salle C5

Peer-to-peer publish/subscribe architectures are an interesting support for scalable distributed data stream applications. Most approaches, often based on brokers, have a static organization which is not much adaptive to different configurations of the participants’ capacities. We present QTor (Query Torrent) a generic organization that enables dynamic adaptation providing a continuum from centralized to fully decentralized solutions.

Learning Path Queries on Graph Databases

Qui: 
Radu Ciucanu
Quand: 
Thursday, September 17, 2015 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du LIRIS 501.301

Learning Path Queries on Graph Databases

Active Data: Enabling Smart Data Life Cycle Management for Large Distributed Scientific Data Sets

Qui: 
Anthony SIMONET
Quand: 
Tuesday, September 15, 2015 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle 501.337

In many domains, scientific discoveries rely increasingly on our ability to exploit ever growing volumes of data. A key point is managing the complexity of data life cycles, i.e. the various operations that happen to data from their creation to their deletion: transfer, archival, replication, disposal, etc. These formerly straightforward operations become intractable when data volume grows dramatically, because of the heterogeneity of data management software on the one hand, and the complexity of the infrastructures

A Survey of FRBRization Techniques

Qui: 
Joffrey Decourselle
Quand: 
Tuesday, September 1, 2015 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

The Functional Requirements for Bibliographic Records (FRBR), an emerging model in the bibliographic domain, provide interesting possibilities in terms of cataloguing, representation and semantic enrichment of bibliographic data. However, the automated transformation of existing catalogs to fit this model is a requirement towards a wide adoption of FRBR in libraries. The cultural heritage community proposed a notable amount of FRBRization tools and projects, thus making it difficult for practitioners to compare and evaluate them.

Big Data: Parameter Analysis and Implementation in Hadoop Platform

Qui: 
Prasan Kumar Sahoo
Quand: 
Thursday, July 23, 2015 - 11:00 to 12:30
Où: 
Salle de réunion du Liris, bâtiment Nautibus, 2° étage, Université Lyon 1

Parameter analysis and future disease prediction of health related Big Data are still in an informative stage due to the diversified bulky health care data, which is generated with greater speed. In this talk, data collection architecture and parameter analysis methods of healthcare Big Data will be discussed. Real implementation of ECG batch data in single cluster Apache Hadoop through the MapReduce framework will be presented.

Short Bio:

Harnessing Human Intelligence in Big Data Analytics

Qui: 
Karl Aberer
Quand: 
Wednesday, July 8, 2015 - 10:00 to 12:00
Où: 
Blaise Pascal, salle 501.337 (amphi formation continue)

Karl Aberer est le responsable du "Distributed Information Systems Laboratory" à l'EPFL.
http://lsir.epfl.ch/aberer/

Ce séminaire est ouvert à tous les membres du LIRIS.

Journée M2R 2015

Qui: 
Les étudiants de M2R
Quand: 
Thursday, June 18, 2015 - 09:30 to 17:00
Où: 
Nautibus, salle C4

Journée de présoutenances des master recherche, organisée par le pôle Data Science.

Inference Leakage Detection for Authorization Policies over RDF Data

Qui: 
Tarek Sayah
Quand: 
Tuesday, June 9, 2015 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

Présentation d'article accepté à http://dbsec2015.di.unimi.it/

Vers un langage déclaratif unifié à base d’ « artifacts » pour raisonner sur les objets connectés et gérer leur flux d’évènements

Qui: 
Youakim Badr
Quand: 
Tuesday, May 5, 2015 - 13:00 to 14:00
Où: 
Lyon1, bâtiment Nautibus, RdC, salle C5

L'émergence de l’Internet des Objets et ses applications réparties à large échelle ont transformé le Web en un gisement gigantesque de sources de données produisant à l’infinie de flux de données hétérogènes. Cette évolution a mis en évidence le besoin de langages de haut niveaux permettant pas seulement une représentation abstraite (Linked data) des objets connectés mais également une capacité de formalisation et de raisonnent sur les flux d’évènement (bases de données) et les processus qui les manipulent sur le Web.

Semantic Data Streams Management

Qui: 
Frédérique Laforest
Quand: 
Monday, May 4, 2015 - 13:00 to 14:00
Où: 
Lyon1, bâtiment Nautibus, RdC, salle C5

Log-driven user-centric OLAP

Qui: 
Patrick Marcel
Quand: 
Thursday, April 30, 2015 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

L'aide à l'exploration interactive de grandes bases de données attire de plus en plus d'attention, comme en témoignent de nombreuses approches proposées récemment (query recommendation, query reuse, query steering, query personalization, etc.). L'analyse exploratoire d'entrepôt de données (exploratory OLAP) peut être vu comme un cas d'usage emblématique d'analyse interactive, dans le sens où il s'agit de naviguer et analyser une masse de données selon la meilleure perspective.

Vers de nouvelles approches incrémentales et flexibles pour l’analyse précise des grandes collections de données dynamiques

Qui: 
Jean-Charles Lamirel
Quand: 
Tuesday, April 28, 2015 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

Etant donné l’évolution de la notion de texte et la croissance continue des informations textuelles et numériques, de multiples natures, qui sont disponibles en ligne, un des challenges importants pour les linguistes et les analystes de l’information, afin de pouvoir formuler des hypothèses et de valider des modèles, est d’exploiter des outils efficaces pour l’analyse textuelle, capables de s’adapter à des volumes importants de données hétérogènes, changeantes et souvent et de nature distribuée.

Big data on-line analytics : évolution ou révolution ? Application aux données textuelles

Qui: 
Fadila Bentayeb
Quand: 
Monday, April 27, 2015 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

L’émergence de grands volumes de données, imposée par les grands acteurs du Web, nécessite de nouveaux modèles de gestion de données et de nouvelles architectures de stockage et de traitement sécurisés capables de trouver une information rapidement dans une grande masse de données, appelée big data. La variété, la volumétrie, la vélocité et la vitesse des big data ont fait émerger de nouveaux verrous scientifiques.

Beyond declarative mapping and cleaning

Qui: 
Paolo Papotti
Quand: 
Friday, April 10, 2015 - 13:00 to 14:00
Où: 
Lyon1, bâtiment Nautibus, RdC, salle C4

In the "big data" era, data integration is a popular activity both in academia and in industry. Integrating hundreds of heterogeneous sources on a daily basis requires a great amount of manual work in order to have data that is polished enough to be useful in the final applications, such as querying and mining. The problem is even harder in practice, as data is often dirty in nature because of typos, duplicates, and so on, that can lead to poor results in the analytic tasks.

Le Web des Objets vu par les données: enjeux et perspectives

Qui: 
Michael Mrissa
Quand: 
Tuesday, April 7, 2015 - 13:00 to 14:00
Où: 
Lyon1, bâtiment Nautibus, RdC, salle C5

TBD

Page de l'orateur : http://liris.cnrs.fr/~mmrissa/

Tuple-Based Access Control: a Provenance-Based Information Flow Control for Relational Data

Qui: 
Romuald Thion
Quand: 
Tuesday, March 31, 2015 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

This paper proposes a flexible control framework for relational personal data that enforces data originators' dissemination policies. Inspired by the sticky policy paradigm and mandatory access control, dissemination policies are linked with atomic data and are combined when different pieces of data are merged.

Conformance to legal requirements, the last frontier for privacy research

Qui: 
Luigi Logrippo
Quand: 
Tuesday, March 24, 2015 - 10:30 to 12:00
Où: 
Lyon1, bâtiment Nautibus, RdC, salle C1

Abstract: Privacy protection systems must conform to legal requirements. These requirements must be identified and extracted from legal texts to become implementation requirements. This is a complex endeavor, in part because legal texts are based on implicit ontologies that should be well understood although in reality they are fuzzy and unstable. These ontologies can be drawn from all fields of knowledge, including science, ethics, as well as common sense; accordingly, they may be as hard to represent and implement as anything a software engineer can become involved with.

An overview of the CEDAR Project

Qui: 
Hassan Aït-Kaci, CEDAR Project Chair
Quand: 
Tuesday, March 3, 2015 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

CEDAR (Constraint Event Driven Automated Reasoning) is two-year ANR Chair of Excellence project at the LIRIS that has just recently reached completion as per its planned schedule (Jan. 2013 - Jan. 2015). In this presentation, I will overview the issues and challenges taken on by the project - essentially the systematic experimental evaluation of Semantic Web reasoning systems (Track 1) and the management of Big Linked Data (Track 2), as well as proposing our own systems for each track.

Projet Petasky : de Hive à HadoopDB au modèle Bulk Synchronous Parallel (BSP)

Qui: 
Amin Mesmoudi
Quand: 
Tuesday, February 24, 2015 - 13:00 to 14:00
Où: 
Nautibus, C5

Synthèse des travaux dans le cadre du projet Petasky : benchmarks sur Hive et HadoopDB et présentation du modèle BSP, alternatif à MapReduce

PABench: Designing a Taxonomy and Implementing a Benchmark for Spatial Entity Matching

Qui: 
Bilal Berjawi
Quand: 
Tuesday, February 17, 2015 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

The tremendous increase of data sources containing spatial information is bound up with the diversity of geospatial applications such as location-based services (LBS) and global positioning systems. LBS providers use maps to locate spatial entities referring to points of interest (POI), for instance restaurants or locations of events. In our study, we specifically focus on places that tourists can get through LBS.

Projet scientifique SQuRE : Scalability and Quality for Resolution of Entities.

Qui: 
Nicolas Lumineau
Quand: 
Tuesday, February 3, 2015 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

SQuRE est un projet scientifique qui traite des aspects liés à l'intégration de données en se focalisant tout particulièrement sur l'alignement d'entités. L'idée principale est de combiner deux types de solution pour l'alignement d'entités : les approches distribuées permettant le passage à l'échelle de l'alignement et les approches itératives offrant une meilleure qualité d'alignement.

GdT "Traitement distribué de requêtes"

Qui: 
Roland Kotto-Kombi
Quand: 
Tuesday, February 3, 2015 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

Présentation dans le cadre du Groupe de Travail "Traitement distribué de requêtes"

RQL/SatQL : un langage “à la SQL” pour découvrir des règles à partir des données.

Qui: 
Emmanuel Coquery
Quand: 
Tuesday, January 13, 2015 - 13:00 to 14:00
Où: 
Nautibus, C5

Suite du séminaire http://liris.cnrs.fr/bd/?q=node/169 du 02/12/14

RQL: un langage “à la SQL” pour découvrir des règles à partir des données.

Qui: 
Emmanuel Coquery
Quand: 
Tuesday, December 2, 2014 - 13:00 to 14:00
Où: 
Nautibus, C5

RQL (pour Rule Query Language) est un langage de requêtes "à la SQL" qui étend et généralise les dépendances fonctionnelles à de nouvelles catégories de règles. RQL apporte aux analystes de données un outil pratique pour découvrir les implications logiques entre attributs d’une base de données. Ces implications peuvent mettre en évidence des problèmes de qualité de données ou de nouvelles corrélations inattendues entre les attributs. Le traitement de ces requêtes RQL est basé sur une technique de réécriture qui délègue un maximum de calculs au SGBD sous-jacent.

Problème d'inférence et contrôle d'accès dans les systèmes d'intégration de données (soutenance blanche de thèse)

Qui: 
Mehdi Haddad
Quand: 
Tuesday, November 25, 2014 - 13:00 to 15:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

Pré-soutenance de thèse de Mehdi. La soutenance aura lieu le 01/12/2014 à 10h salle de réunion IF (502.321)

Visualisation de l'incertitude des entités spatiales intégrées

Qui: 
Bilal Berjawi
Quand: 
Tuesday, July 22, 2014 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

Plusieurs fournisseurs de services de geolocalisation (GoogleMaps, BingMaps, ...) offrent des information à propos des Point d'Intérêts (POIs) et qui les représentent sur des cartes. Les données de ces fournisseurs sont parfois incompletes et parfois inconsistantes entre eux. On propose d'intégrer les POIs de ces fournisseurs pour offrir des données plus précises aux utilisateurs.

Approches pour la gestion de configurations de sécurité dans les systèmes d'information distribués

Qui: 
Matteo Casalino
Quand: 
Tuesday, June 24, 2014 - 13:00 to 14:30
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

Pré soutenance de la thèse de Matteo. 45' de présentation suivi de discussions/retours.

Pré-soutenances des M2R du pôle Data Science

Qui: 
Stagiares M2R du pôle
Quand: 
Friday, June 13, 2014 - 09:30 to 12:15
Où: 
Réunion IF (502.321), Blaise Pascal, INSA

9h30:10h10 - (GRAMA) Ghizlane Echbarthi (M2R, Juin): Graphes pour les grandes masses de données en flux [Hamamache]
10h10:10h50 - (BD) Kamel Taouche (M2R TI, Juin): Optimisation d'un algorithme de traitement de requêtes agrégées et approximatives (Suite ANR AOC) [Fabien (Duchateau), Nicolas, Saïd]
10h50:11h30 - (BD) Mehdi Benaïssa (M2R IADE, Juin): Alignement d'entités sémantiques basé sur Map Reduce et sur des sources de référence (PHC KOGAR) [Fabien (Duchateau), Nicolas]

Pré-soutenances des M2R du pôle Data Science

Qui: 
Stagiares M2R du pôle
Quand: 
Thursday, June 12, 2014 - 14:00 to 16:00
Où: 
Salle C5, Nautibus, Lyon 1

14h00:14h40 - (DM2L) Antoine Patel (M2R, ML, Juin): Co-sélection instances-variables pour l'apprentissage semi-supervisé (Khalid, Haytham)
14h40:15h20 - (DM2L) Pierre-Alain Roullet (M2R, ML, Juin): Détection de nouveautés à partir de séries temporelles : Application à la détection de prix aberrants en pneumatique (Khalid, Alexandre)
15h20:16h00 - (DM2L) Wafa Saadaoui (M2R, Juin) Approche ensembliste pour la classification multi-label à partir de données textuelles (Haytham, Alex)

Pré-soutenances des M2R du pôle Data Science

Qui: 
Stagiares M2R du pôle
Quand: 
Thursday, June 12, 2014 - 10:00 to 11:30
Où: 
Salle C5, Nautibus, Lyon 1

10h00:10h40 - (BD) Ameni Ayadi (M2R, Juin): Exploration des données à base de contre-exemples [Manu, Jean-Marc]
10h40:11h20 - (BD&DM2L) Roland Kotto Kombi (M2R): projet transverse "olfamining" [Fabien De Marchi, Mehdi Kaytoue, Marc Plantevit]

Pré-soutenances des M2R du pôle Data Science

Qui: 
Stagiares M2R du pôle
Quand: 
Wednesday, June 11, 2014 - 14:00 to 17:00
Où: 
Réunion IF (502.321), Blaise Pascal, INSA

14h00:14h40 - (BD) Sara Allaoui (M2R, Juin): Gestion des objets complexes: Développement d'une Interface SPARQL pour supporter les requêtes LIFE (Projet CEDAR) [Hassan Aït-Kaci]
14h40:15h20 - (BD) Kevin Sancho (M2R, Juin): The Cedar.gdl Library for the Generalized Distributive Law (Projet CEDAR) [Hassan Aït-Kaci]
15h40:16h20 - (BD) Tanguy Raynaud (M2R, Juin): Cache Only Memory-based architecture for Big Data Applications (Projet CEDAR) [Rafiq, Hassan Aït-Kaci]

Optimisation sémantique des requêtes continues : Application aux bâtiments intelligents

Qui: 
Manel Charfi
Quand: 
Tuesday, June 3, 2014 - 13:00 to 14:00
Où: 
Nautibus, Salle C5 (rdC)

Les bâtiments intelligents sont des bâtiments dans lesquels les nouvelles technologies ont été introduites dans le but de simplifier la vie de l’occupant, d’assurer son confort, de veiller à sa santé, à sa sécurité ainsi qu’à celle du bâtiment. Dans ce cadre, une attention particulière doit être portée à l'économie d'énergie, afin de préserver au mieux l’autonomie des capteurs/actionneurs présents dans le bâtiment et d’assurer la continuité du service.

A High Level Query Language for Big Data Analytics

Qui: 
Nicolas Spyratos (LRI)
Quand: 
Wednesday, May 21, 2014 - 14:30 to 15:30
Où: 
Salle C4, Bâtiment Nautibus, Université Lyon I

We present a high level query language for expressing analysis tasks as queries over big data sets, independently of how the analysis task is to be carried out or what are the computing resources used by the system and what is the structure and physical layout of data: a query in our language is defined at the conceptual level and then mapped to lower level evaluation mechanisms for computing the answer. Our overall objective is to have query formulation done on an abstract level, while actual query evaluation can adapt to the evaluation mechanisms offered in each case.

Benchmarking SQL-On-MapReduce systems using big astronomy databases

Qui: 
Amin Mesmoudi
Quand: 
Tuesday, May 6, 2014 - 13:00 to 14:00
Où: 
Nautibus, Salle C5 (rdC)

With the amount of data produced in several application domains, it is increasingly difficult to manage and query related large data repositories. Within the PetaSky project (http://com.isima.fr/Petasky), we focus on the problem of managing scientific data in the field of cosmology. The data we consider are those of the LSST project (http://www.lsst.org/). The overall expected size of the database that will be produced will exceed 60 PB.

Access Control for Data Integration in Presence of Data Dependencies

Qui: 
Mehdi Haddad
Quand: 
Tuesday, April 15, 2014 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

Defining access control policies in a data integration scenario is a challenging task. In such a scenario typically each source specifies its local access control policy and cannot anticipate data inferences that can arise when data is integrated at the mediator level. Inferences, e.g., using functional dependencies, can allow malicious users to obtain, at the mediator level, prohibited information by linking multiple queries and thus violating the local policies. In this paper, we propose a framework, i.e., a methodology and a set of algorithms, to prevent such violations.

Synthèse sur le contrôle d'accès aux données RDF(-S)

Qui: 
Tarek Sayah
Quand: 
Tuesday, March 25, 2014 - 13:00 to 14:00
Où: 
Nautibus, Salle C5 (RdC)

Tarek Sayah, doctorant 1ere année dans l'équipe BD, présentera un travail de synthèse sur le contrôle d'accès aux données RDF. Des critères de comparaison sont identifiés (expressivité du langage de sélection des objets, méthodes de résolution des conflits de décisions, ...) et un ensemble de propositions comparées vis-à-vis des ces critères. Un ensemble de directions de travail de thèse sera présenté en conclusion.

New Perspectives in Social Data Management (séminaire Liris)

Qui: 
Sihem AMER-YAHIA, Directrice de recherche CNRS, LIG Grenoble
Quand: 
Tuesday, March 18, 2014 - 10:30 to 12:00
Où: 
Salle C2, Bâtiment Nautibus, Université Lyon I

Séminaire du LIRIS de Sihem AMER-YAHIA invitée par l'équipe BD
http://liris.cnrs.fr/evenements-en/NewPerspectivesInSocialDataManagement

Privacy-Preserving Query Execution using a Decentralized Architecture and Tamper Resistant Hardware

Qui: 
Benjamin Nguyen - Université Versailles St-Quentin (UVSQ), PRiSM Lab, INRIA SMIS
Quand: 
Tuesday, March 11, 2014 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, Salle du Liris

Current applications, from complex sensor systems (e.g. quantified self) to online e-markets acquire vast quantities of personal information which usually ends-up on central servers. Decentralized architectures, devised to help individuals keep full control of their data, hinder global treatments and queries, impeding the developmentof services of great interest.

Introduction à Datalog

Qui: 
Jean-Marc Petit, Yann Gripay
Quand: 
Monday, March 10, 2014 - 12:30 to 13:15
Où: 
Nautibus, Salle C4 (rdC)

Jean-Marc et Yann proposent un séminaire introductif (de rappel) à Datalog.
http://webdam.inria.fr/Alice/pdfs/Chapter-12.pdf

Inférence de règles de contrôle d'accès pour assurer la confidentialité des données au niveau des vues matérialisées

Qui: 
Sarah Nait Bahloul
Quand: 
Tuesday, November 26, 2013 - 13:00 to 15:00
Où: 
Bâtiment Blaise Pascal, salle de réunion du Liris

Pré soutenance de la thèse de Sarah. 45' de présentation suivi de discussions/retours.

CEDAR Project: present and future

Qui: 
Samir Amir
Quand: 
Friday, November 22, 2013 - 11:00 to 12:15
Où: 
Nautibus, Salle de réunion du Liris (2° étage)

The two main challenges for the coming to pass of the Semantic Web are scalability and distribution. The problem of scalability is that a well-designed web-oriented knowledge-based system must be able to handle larger and larger volumes of knowledge without unbearable degradation of performance. Dealing with the second challenge — distribution — is as complex an issue since it must deal efficiently and seamlessly with knowledge spread all over the Internet under “real-life” conditions (cache management, handling faulty connections and time delays, query distribution, etc.).

Generating Data to Understand Data

Qui: 
Arno Siebes (invité DM2L)
Quand: 
Tuesday, November 12, 2013 - 12:30 to 14:00
Où: 
Bâtiment Blaise Pascal, salle du Liris

It is about the research he has been doing during his sabbatical, it is very new and not even published. It takes a more abstract view on pattern mining and it uses algorithmic statistics to determine good sets of patterns (phrased differently: it also takes a more abstract view on MDL (the coding of the data is indirect)).
Many results that are only approximately true for Krimp (and only "proven'" experimentally for Krimp (because they are theoretically false)) are theoretically true for this new approach.

Opportunités de collaboration scientifique en informatique avec le Mexique

Qui: 
David Sol - Tecnológico de Monterrey, Campus Puebla
Quand: 
Tuesday, September 17, 2013 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, salle du Liris

La recherche scientifique et les projets en informatique peuvent être utilisés pour résoudre des problèmes de notre société. Le laboratoire LIRIS développe ce type de recherche dans le groupe de bases de données parmi lesquels il a des projets développés avec le Mexique. La présentation montrera les efforts que nous avons réalisés dans le cadre de notre collaboration. La recherche s’est dirigée vers la génération et la gestion de la connaissance dans le domaine des bases de données géo-spatiales.

Complexité paramétrée : application aux requêtes conjonctives

Qui: 
Alex Peyrard
Quand: 
Wednesday, July 10, 2013 - 10:00 to 11:00
Où: 
Bâtiment Blaise Pascal, salle IF

Mining State Dependencies Between Multiple Sensor Data Sources

Qui: 
Vasile-Marian Scuturici
Quand: 
Tuesday, July 2, 2013 - 13:00 to 14:00
Où: 
Bâtiment Nautibus, Salle C3

Pattern mining over data streams is critical to a variety of applications such as prediction and evolution of weather phenomena or anomaly detection in security applications. Most of the current techniques attempt to discover associations between events appearing on the same data stream but are not able to discover associations over multiple heterogeneous data streams. In this work, we aim to identify temporal dependencies between data streams. We represent event streams by state streams that are induced by the streams' events themselves.

Conceptual Models for Bibliographic Information

Qui: 
Trond Aalberg, NTNU (Norvège)
Quand: 
Thursday, June 20, 2013 - 10:30 to 12:00
Où: 
Bâtiment Nautibus, Salle C4

The library domain has for the last decades been struggling with the implementation of new information models to support modern requirements for exchange, management and use of bibliographic information. This talk will give an introduction to the reference model that was introduced in the Functional Requirements for Bibliographic Records (FRBR), describe some of the main challenges and present development and research that we have performed related to the implementation and exploitation of this model.

Detection, Integration and Correction Methods for Homologous Geographic Objects (projet UNIMAP)

Qui: 
Bilal Berjawi
Quand: 
Tuesday, May 28, 2013 - 13:00 to 14:00
Où: 
INSA de Lyon, bât. Blaise Pascal, salle de réunion du Liris

In the market there are several providers for Location-Based Services, and each of them uses its own concepts, models and data. As a consequence, customers obtain different answers from one provider or from another . In this context, the UNIMAP project aims at providing Location-Based Services in which data from various suppliers are aggregated. This ensures the completeness and the correction of the results for a given query. However, the main research question is to deal with the detection and the integration of homologous objects from the databases of these suppliers.

Overview of the CEDAR Project: Constraint Event-Driven Automated Reasoning

Qui: 
Hassan AÏT-KACI (ANR Chair of Excellence)
Quand: 
Tuesday, March 26, 2013 - 10:30 to 12:00
Où: 
INSA de Lyon, amphi Claude Chappe

The two main challenges for the coming to pass of the Semantic Web are scalability and distribution. The problem of scalability is that a well-designed web-oriented knowledge-based system must be able to handle larger and larger volumes of knowledge without unbearable degradation of performance. Dealing with the second challenge — distribution — is as complex an issue since it must deal efficiently and seamlessly with knowledge spread all over the Internet under “real-life” conditions (cache management, handling faulty connections and time delays, query distribution, etc.).

On ubiquity of implications (and how to avoid computing all of them) (séminaire mensuel Liris)

Qui: 
Sergei O. Kuznetsov
Quand: 
Tuesday, March 12, 2013 - 10:30 to 12:00
Où: 
INSA de Lyon, amphi Claude Chappe

Séminaire mensuel du LIRIS par Sergei O. Kuznetsov, National Research University Higher School of Economics (Moscow, Russia)

http://liris.cnrs.fr/evenements/OnUbiquityOfImplications

Dynamic Cubing for Hierarchical Multidimensional Data Space (soutenance blanche)

Qui: 
Usman Ahmed
Quand: 
Tuesday, January 29, 2013 - 13:00 to 14:30
Où: 
Bâtiment Nautibus, Salle C2

La soutenance sera le 18 février

Introduction aux BD bitemporelles et orientées colonnes

Qui: 
Azhar Ait Ouassarah
Quand: 
Tuesday, November 13, 2012 - 13:00 to 14:00
Où: 
INSA, bât Blaise Pascal, salle du Liris (3° étage)

Dans le cadre de ma thèse Cifre (collaboration entre l'équipe BD et l'entreprise Systar), je dois travailler sur l'amélioration des performances d'un SGBD bien particulier qui est bitemporel et orienté colonne. Ce séminaire sera l'occasion de présenter le contexte de mes travaux, puis d'expliquer ces deux concepts et enfin de présenter certaines pistes de travail.

Approche communautaire pour l'évaluation de requêtes

Qui: 
Sébastien Dufromentel
Quand: 
Tuesday, October 23, 2012 - 13:00 to 14:00
Où: 
Bâtiment Nautibus, Salle C2

Sébastien commence une thèse sur le sujet.

Gestion de données prévisionnelles : optimisation et maintenance

Qui: 
Haitang Feng
Quand: 
Tuesday, October 9, 2012 - 13:00 to 14:30
Où: 
Bâtiment Nautibus, Salle C2

Soutenance de thèse blanche.

Voir http://liris.cnrs.fr/membres/?idn=hfeng&onglet=these

Origines, évolution and défis de la technologie SOLAP

Qui: 
Yvan Bédard
Quand: 
Friday, September 28, 2012 - 13:00 to 14:30
Où: 
Bâtiment Nautibus, Salle C2

Résumé : Les premiers projets faisant appel à l’intégration des concepts OLAP avec les données géospatiales remontent au milieu des années 1990. Principalement sujets de recherche, ces projets furent rapidement suivis par les premières implantations industrielles. Alors que le nombre de projets Spatial OLAP (SOLAP) augmentait dans les premières années de la décennie précédente, c’est au milieu de cette dernière que les premières solutions SOLAP commerciales sont apparues.

The Extended MDLP (Minimum Description Length Principle) for Transfer Learning

Qui: 
Shao Hao
Quand: 
Monday, September 3, 2012 - 13:00 to 14:00
Où: 
INSA, bât Blaise Pascal, salle du Liris (3° étage)

Calcul de bordures et applications

Qui: 
Sofian Maabout
Quand: 
Monday, July 9, 2012 - 12:30 to 13:15
Où: 
INSA, bât Blaise Pascal

Etant donnés un ensemble d'objets O et une fonction booléenne d'intérêt q: 2^O-> {vrai, faux}, la bordure de 2^O est l'ensemble des éléments o de 2^O extrémaux (minimaux ou maximaux) tels que q(o)=vrai. On retrouve le concept de bordures dans plusieurs applications, ex: les itemsets fréquents maximaux, les dépendances fonctionnelles approximatives et le stockage partiel des cubes de données.

Access Control Configuration for J2EE Web Applications: A Formal Perspective

Qui: 
Matteo Casalino
Quand: 
Monday, July 2, 2012 - 12:30 to 14:00
Où: 
Nautibus, salle C5

Business services are increasingly dependent upon Web applications. Whereas URL-based access control is one of the most prominent and pervasive security mechanism in use, failure to restrict URL accesses is still a major security risk.We argue that this risk can be mitigated by providing formal analysis tools to evaluate access control policies as well as the impact of changes on configurations.

Réunion bilan des 4 années

Qui: 
Jean-Marc Petit
Quand: 
Tuesday, June 26, 2012 - 16:00 to 18:00
Où: 
INSA, bât Blaise Pascal, salle du Liris (3° étage)

Cela fait pile poil 4 ans que nous avons créé officiellement l'équipe BD.
Pour ce quadriennal écoulé, je pense opportun de faire un petit bilan.
J'en profiterai aussi pour parler de son avenir et de mes engagements vis à vis d'elle.
J'invite chaque permanent à préparer, s'il le souhaite, un bilan global et/ou personnel.

J'envisage la réunion comme cela : bilan quadriennal + avenir (JMP), tour de table.

La réunion est limitée aux membres permanents de l'équipe.

Treillis : structures, algorithmes et quelques usages

Qui: 
Karell Bertet
Quand: 
Tuesday, June 5, 2012 - 10:30 to 12:00
Où: 
Amphi Claude Chappe, INSA de Lyon

Le premier ouvrage de référence de la théorie des treillis est la première édition du livre de Birkhoff en 1940. Cependant, la notion de treillis a été introduite dès la fin du 19ème siècle comme une structure algébrique munie de deux opérateurs appelés borne inférieure et borne supérieure.

Matérialisation partielle et interrogation d'un hyper-cube de données dynamiques

Qui: 
Ahmed Usman
Quand: 
Monday, June 4, 2012 - 12:30 to 14:00
Où: 
Bâtiment Nautibus, Salle C4

Les entrepôts de données ont généralement une stratégie de chargement des données par bloc et hors ligne ce qui les rendent peu compatibles avec des applications où les performances en temps sont critiques. Dans ce travail, nous présentons un modèle multidimensionnel pour entreposer en temps réel les données d'un espace multidimensionnel hiérarchique. Nous proposons une matérialisation partielle de l'hypercube de données dans une structure d'arbre qui regroupe les données multidimensionnelles dans des partitions non ordonnées appelées Minimum Bounding Spaces (MBS).

Authorization Policies for Materialized Views

Qui: 
Sarah Nait Bahloul
Quand: 
Tuesday, May 29, 2012 - 12:30 to 14:00
Où: 
INSA, bât Blaise Pascal, salle du Liris (3° étage)

Présentation d'un article accepté à http://www.sec2012.org/ suivie d'une discussion sur la continuité du travail.

Principles of Distributed Data Management in 2020

Qui: 
Patrick Valduriez (Zenith, LIRMM, INRIA)
Quand: 
Thursday, May 10, 2012 - 10:30 to 12:00
Où: 
Amphi Claude Chappe, INSA de Lyon

Invité dans le cadre des séminaires mensuels du Liris, par l'équipe BD
https://liris.cnrs.fr/seminaires/seminaires-mensuels/seminaires-mensuels

Data integration in presence of authorization policies

Qui: 
Mehdi Haddad
Quand: 
Friday, May 4, 2012 - 12:30 to 13:30
Où: 
INSA, bât Blaise Pascal, salle 337 (amphi FC)

Information is more and more stored over distributed sources. A simple access to information in these sources requires a single access point. Data integration methods are designed to provide this kind of access by allowing to specify a mediator between the users and the sources. From an access control point of view, the question is how to specify access control of a system built on top of distributed data sources. Each source specifies and enforces its own policies. So, an access control enforced at the mediator level has to preserve the local access controls (of the sources).

Extraction de motifs numériques avec l'analyse de concepts formels

Qui: 
Mehdi Kaytoue
Quand: 
Tuesday, April 24, 2012 - 12:30 to 13:30
Où: 
Bâtiment Nautibus, Salle C5

L'analyse de concepts formels (ACF) est une méthodologie d'analyse de données qui permet d'organiser au sein d'une hiérarchie un ensemble d'objets décrits par leur attributs. Le dit "treillis de concepts" est support à de nombreuses tâches de fouilles de données et gestion des connaissances.

Millions of Researchers… Which Ones Can Collaborate with Me??? (Séminaire équipe DRIM)

Qui: 
Anthony Ventresque
Quand: 
Thursday, April 5, 2012 - 10:00 to 11:30
Où: 
INSA, Amphi Gaston Berger (informatique)

Forming multidisciplinary teams is a key to carry out complex tasks, which is increasingly the case higher up in the knowledge value chain. Need for team recommendation systems has always been there, both in product companies or academy. Many studies show that in academic world number of authors per paper and coauthors per author are high and increasing.

Hierarchy-based Update Propagation in Decision Support Systems

Qui: 
Haitang Feng
Quand: 
Monday, March 26, 2012 - 12:30 to 13:30
Où: 
Nautibus, salle C5

Sales forecasting systems are used by enterprise managers and executives to better understand the market trends and prepare appropriate business plans. These decision support systems usually use a data warehouse to store data and OLAP tools to visualize query results. A specific feature of sales forecasting systems regarding future predictions modification is backward propagation of updates, which is the computation of the impact of modifications on summaries over base data. In Data warehouses, some methods propagate updates in hierarchies when data sources are subject to modifications.

P-Bench: benchmarking in data-centric pervasive application development

Qui: 
Sabina Surdu
Quand: 
Monday, March 19, 2012 - 12:30 to 13:30
Où: 
INSA, bât Blaise Pascal, salle du Liris (3° étage)

Today we are witnessing the commencement of a new information era, the Internet of Things, a planetary web, which interconnects not only data and people, but also quiescent, assorted objects, distributed over large areas. By activating the universe of things surrounding us, we are heading towards Mark Weiser's envisioned world, where computers vanish into the background, fitting smoothly into the user environment and gracefully providing information and services to users, rather than forcing them to adapt to the intricate ambiance from the computing realm.

Nouvelles classes de problèmes de découverte de motifs intéressants dans les bases de données

Qui: 
Jean-Marc Petit
Quand: 
Monday, March 5, 2012 - 12:30 to 13:30
Où: 
INSA, bât Blaise Pascal, salle du Liris

Mannila et Toivonen ont décrit un cadre pour la découverte de motifs intéressants dans les bases de données en 1997. Entre autre chose, ils y ont proposé la classe RAS des problèmes dits représentables par les ensembles. Le problème difficile sous jacent à la découverte des motifs est connu sous le nom de dualisation, qui est le problème d'énumération des transversaux minimaux d'un hypergraphe pour RAS. Son intérêt pratique est que tout problème de RAS peut être résolu par un algorithme d'énumération à délai quasi-polynomial.

End-user Services Composition from a Social Networks Analysis Perspective

Qui: 
Abderrahmane Maaradji
Quand: 
Monday, February 27, 2012 - 12:30 to 13:30
Où: 
Nautibus.C5

Service composition has risen from the need to make information systems more flexible and open. The Service Oriented Architecture has become the reference architecture model for applications carried by the impetus of Internet (Web). In fact, information systems are able to expose interfaces through the Web which has increased the number of available Web services. On the other hand, with the emergence of the Web 2.0, service composition has evolved toward web users with limited technical skills.

Fouille de concepts formels triadiques

Qui: 
Sadok Ben Yahia
Quand: 
Monday, January 30, 2012 - 12:30 to 13:30
Où: 
Nautibus.C4

Ganter et Wille ont introduit la notion de contexte triadique comme l'extension d'un contexte diadique classique par l’ajout d'une nouvelle colonne appelée « condition ». Ce type de contextes est, par exemple, particulièrement intéressant pour représenter formellement des « folksonomies ». Ces derniers, émergeant de l’ère du Web 2.0, permettent aux participants de collaborer via l’indexation libre du contenu à l’aide de mots-clés, les tags ; créant ainsi des structures légères représentées comme des hypergraphes tripartites d’utilisateurs, de tags et de ressources.

Computing Critical Mutations, Relevant Constraints and Causes in LTL-based Compliance Management

Qui: 
François Hantry
Quand: 
Monday, January 23, 2012 - 12:30 to 14:00
Où: 
INSA, bât Blaise Pascal, salle du Liris (3° étage)
  • WHY SO ? (Theoretical result for LTL-based compliance Based management)
  • UMC/SAT-based Solver for Model Checking Business Artifact and Extract Compliance Based Fragments
  • Handling Conflicts in Depth-First Search for LTL Tableau to Debug Compliance Based Languages

Temporized Dependencies in Heterogeneous Data Streams

Qui: 
Marian Scuturici
Quand: 
Monday, January 9, 2012 - 12:30 to 13:30
Où: 
INSA, bât Blaise Pascal, salle du Liris (3° étage)

Projet transverse BD/Combining.

Report du séminaire initialement prévu le 5/12

La gestion de flux de données avec Astral. Application sur le Linear Road Benchmark

Qui: 
Loic Petit
Quand: 
Monday, November 28, 2011 - 12:30 to 13:30
Où: 
INSA, bât Blaise Pascal, salle du Liris (3° étage)

La gestion des flux de données a connu un grand essor au cours des 10 dernières années. Basée sur le modèle relationnel, elle tente de traiter les flux de données de manière déclarative. Toutefois, à cause de sa grande complexité, pour la même requête, les systèmes existants produisent des résultats différents. Astral est une algèbre de gestion de flux de donnée qui permet de clarifier les sémantiques des opérateurs d’un tel système. Afin de montrer que cette algèbre est utilisable, un prototype a été conçu pour traiter les flux tels que décrits par l'algèbre.

A Social Based P2P Recommendation System & Shared Data Overlay Network

Qui: 
Didier Parigot
Quand: 
Wednesday, November 23, 2011 - 13:00 to 15:00
Où: 
UCBL/Nautibus/RdC/Salle visio

Nous allons présenter les concepts et l’architecture d’un noyau pour le développement rapide d’application en pair à pair centre donné, appelé Shared-Data Overlay Network (SON).

Avant de décrire ce noyau P2P, nous allons présenter un outil de recommandation de document, dénommé A Social-Based P2P recommandation system (P2PRec) que nous avons développé à l’aide de SON. P2PRec s’appui sur un protocole gossip pour la propagation des recommandations et une recherche de type « K-top » effectuée à travers le réseaux

Managing Very Large Data Sets in a Cloudy World

Qui: 
Jorge Quiané
Quand: 
Friday, November 18, 2011 - 14:00 to 16:00
Où: 
Blaise Pascal - Amphi FC

Nowadays, many enterprises and organizations are faced to large volumes of data that have to be analyzed in a per-day basis. In particular, scientific datasets are growing at unprecedented rates and are likely to continue growing to the order of Exabytes. These current needs of data management require applications to run over a large number of computing nodes. However, databases management systems (DBMS) have proven inefficient to deal with very large datasets as well as to scale out to a large number of computing nodes.

Découverte des règles d'édition

Qui: 
Thierno Diallo
Quand: 
Wednesday, November 9, 2011 - 12:30 to 14:00
Où: 
Nautibus, salle C4

Les règles d'édition ont été récemment introduites dans le contexte du nettoyage de données. Basées sur le principe de qualité véhiculé par le Master Data Management, elles décrivent comment corriger efficacement les incohérences. Dans cet exposé nous abordons le problème de la découverte de ces règles. A travers une nouvelle sémantique, nous proposons une solution basée sur l'inférence des Dépendances Fonctionnelles Conditionnelles et sur l'extraction de correspondances entre attributs.

Seamless distribution of data-centric applications through declarative overlays

Qui: 
Kassem Ahmad
Quand: 
Monday, October 17, 2011 - 12:30 to 13:30
Où: 
Blaise Pascal

Peer to peer systems have been widely used to alleviate the burden of servers by transferring to peers in a network tasks that do not require a centralization of the information. A wide range of applications are now emerging over peer-to-peer, such as social networking, multiplayer games, mobile messaging, etc.

Most of these applications are essentially data-centric, they rely on exchange of data between peers, and can be expressed by queries over the database.

Data Management in Forecasting Systems: Case Study. Performance Problems and Preliminary Results

Qui: 
Haitang Feng
Quand: 
Monday, October 10, 2011 - 12:30 to 13:00
Où: 
Nautibus, C4

La production de prévisionnels de ventes est un enjeu important dans la mise en place de stratégies commerciales pour les entreprises. Les applications permettant de calculer des prévisionnels exploitent de grandes quantités de données issues des réalisations passées et des modèles statistiques souvent complexes. Les performances de ces applications dépendent de leur capacité à traiter et visualiser avec des latences acceptables pour un usage via le web des masses de données mises à jour périodiquement.

Extending Email Systems with automatic information extraction technique.

Qui: 
Amin Mesmoudi
Quand: 
Tuesday, September 27, 2011 - 12:30 to 13:00
Où: 
Nautibus

keywords: Email, Information Extraction, Semantic query, Text mining.

PFE 5TC INSA - Optimisation des communications d'un moteur de requêtes sur environnement pervasif

Qui: 
Le Thanh Nguyen
Quand: 
Friday, July 1, 2011 - 12:30 to 13:00
Où: 
Nautibus, salle C5

Encadrants: François Lesueur, Yann Gripay
Mots-clés : Environnements pervasifs, Passage à l'échelle, Algorithmes distribués

Publication des données du LIRIS au format RDF

Qui: 
Antoine Zimmermann
Quand: 
Friday, June 24, 2011 - 12:30 to 13:00
Où: 
Blaise Pascal, Salle de réunion du LIRIS

En collaboration avec Pierre-Antoine Champin de l'équipe SILEX, nous avons mis en place un serveur fournissant les données publiques du LIRIS en RDF. Tandis que ces données étaient auparavant exposées au sein de pages Web HTML, elles sont maintenant accessibles soit directement comme des fichiers indépendant en RDF ou par le biais d'un point d'accès SPARQL. Le serveur en question génère les données directement depuis la base de données relationnelle du LIRIS. Antoine présentera l'architecture et fera une démonstration du système qui sera rendu accessible au monde très prochainement.

Journée de présentation des master recherche

Qui: 
Les étudiants de master recherche
Quand: 
Monday, June 20, 2011 - 09:30 to 11:45
Où: 
Nautibus - salle C5

Les pré-soutenances des Master 2 Recherche de l'équipe se dérouleront
le lundi 20 juin 2011 de 9h30 à 11h45 dans la salle C5 du bâtiment Nautibus.

9h30- 10h15 : Asma TALHI
"Langage déclaratif pour les règles: Définition et implémentation"
Encadrants :Jean-Marc PETIT & Yoan RENAUD

10h15- 11h00 : Heni ELGHAZEL
"Agrégation de données pour l’approximation de requêtes sur des bases de données RDF"
Encadrant : Mohand-Said HACID

XD-ER : un modèle conceptuel dédié aux environnements dynamiques

Qui: 
Nicolas Lumineau
Quand: 
Friday, June 10, 2011 - 12:30 to 14:00
Où: 
Nautibus, TD12

Cet exposé intitulé qui fait suite aux travaux effectués dans le cadre du projet OPTIMACS. Résumé: La multiplication d'applications reposant sur des réseaux de capteurs distribués engendre un intérêt croissant pour la modélisation d'applications "pervasives" dans des environnements dynamiques. Ce type d'applications touche des domaines tels que la prévention de risques de tremblements de terre ou d'inondations, la traçabilité de personnes ou d'objets, etc.

La théorie des catégories : Qu'est-ce que c'est ? Quel intérêt en informatique ?

Qui: 
Romuald Thion
Quand: 
Friday, April 22, 2011 - 12:30 to 14:00
Où: 
Nautibus

Il s'agit essentiellement de présenter, du point de vue d'un "amateur non-expert & informaticien" ce qui se cache derrière "la théorie des catégories".

Issue des mathématiques fondamentales modernes, cette théorie est remarquable par sa haute abstraction, ce qui lui vaut le doux surnom de "abstract nonsense" [1]. Atout selon certains, défaut selon d'autres, les catégories trouvent de nombreuses applications en informatique.

Langages de requêtes déclaratifs pour la gestion de données de référence.

Qui: 
Thierno Diallo
Quand: 
Friday, April 15, 2011 - 12:30 to 14:00
Où: 
Blaise Pascal

La gestion de données de référence, plus connue sous le sigle MDM pour « Master Data Management », est la discipline des technologies de l'information qui s'applique aux données de référence partagées par plusieurs Systèmes d’Information (SI), systèmes informatiques ou bases de données...

Tatouage par création d'information : application aux ontologies avec instances

Qui: 
David Gross-Amblard
Quand: 
Friday, April 8, 2011 - 12:30 to 13:30
Où: 
Nautibus

Le tatouage est une technique de dissimulation d'information dans les documents électroniques (images, sons, bases de données) permettant de réaliser des preuves de propriété intellectuelle, de l'authentification ou du suivi de fuites de données.

Access Control to Matarialized Views: an Inference-Based Approach

Qui: 
Sarah Nait Bahloul
Quand: 
Friday, March 18, 2011 - 12:30 to 14:00
Où: 
Blaise Pascal

Visualisation de digests d'emails

Qui: 
Romain Vuillemot
Quand: 
Friday, March 18, 2011 - 12:30 to 14:00
Où: 
Salle de réunion LIRIS INSA

Je sélectionne un ensemble de N emails, et je ne veux visualiser qu'un seul email en retour: quelles sont les techniques d'aggrégation de données et de visualisation à mettre en place ? Dans quelles mesures les spécificités des emails (champs semi-structurés en en-têtes, texte libre, conversations, etc.) peuvent-elles faciliter/compléxifier ce problème ? A notre connaissance aucun travaux n'a été realisé dans ce domaine et les applications sont très prometteuses.

Machine Learning and Data Mining for Autonomous Mobile Robots

Qui: 
Einoshin Suzuki
Quand: 
Wednesday, March 16, 2011 - 11:00 to 12:00

In this talk, we present some of our works, biased toward our side, done under a Japanese-French project on applying machine learning and data mining to the design problem of swarm robot controllers. Recently we have witnessed a remarkable progress both in hardware and software concerning mobile robots that learn and discover. Our applications concern several tasks including patrol, formation control, human avoidance, and discovery, which are accomplished in simulator, closed arena, and office environments.

Disclosure Detection over Data Streams in Database Publishing

Qui: 
Deming Dou
Quand: 
Friday, March 11, 2011 - 12:30 to 14:00
Où: 
Nautibus

Schema Mapping and Query Translation in Heterogeneous P2P XML Databases

Qui: 
Angela Bonifati
Quand: 
Monday, February 21, 2011 - 12:30 to 13:30
Où: 
Blaise Pascal

Peers in a peer-to-peer data management system often have heterogeneous schemas and no mediated global schema. To translate queries across peers, we assume each peer provides correspondences between its schema and a small number of other peer schemas. We focus on query reformulation in the presence of heterogeneous XML schemas, including data-metadata conflicts. We develop an algorithm for inferring precise mapping rules from informal schema correspondences. We define the semantics of query answering in this setting and develop query translation algorithm.

Combining annotation domains in Annotated RDFS

Qui: 
Antoine Zimmermann
Quand: 
Friday, February 18, 2011 - 12:30 to 14:00
Où: 
Nautibus

Dans la continuité de ma première présentation, je parlerai de mes derniers travaux, en partie réalisés pendant les deux semaines où j'étais en Irlande en janvier. Partant d'un cadre assez intuitif de logique annotée (en l'occurence, Annotated RDFS), je m'intéresse à la sémantique et aux inférences dans le cas où l'on combine plusieurs types d'annotations (par exemple, annotation temporelle et annotation floue). Le problème à première vue simple se révèle bien plus complexe et profond qu'il n'y parait.

Exploration de grands ensembles de motifs

Qui: 
Marie Ndiaye
Quand: 
Friday, February 11, 2011 - 12:30 to 13:30

L’abondance des motifs générés par les algorithmes d’extraction de connaissances représente un grand problème dans le domaine de fouille de données. Afin de faciliter l’exploration de ces motifs, deux approches sont souvent utilisées : la première consiste à résumer les ensembles de motifs extraits et la seconde approche repose sur la construction de représentations visuelles de ces motifs. Cependant, les résumés ne sont pas structurés et ils sont proposés sans méthode d’exploration.

Séminaire Daniel Le Métayer

Qui: 
Daniel Le Métayer
Quand: 
Tuesday, February 1, 2011 - 11:00 to 12:00

Le traitement informatique des normes (au sens des règles qui peuvent s'appliquer à des personnes ou des organisations: contrat, règlement, loi, etc.), même s'il peut s'appuyer sur certaines techniques connues, notamment du génie logiciel (compositionnalité, gestion de logs, etc.), des méthodes formelles (spécification, vérification, etc.) et de la sécurité informatique (contrôle d'accès, authentification, etc.) introduit des besoins particuliers et pose des défis nouveaux.

Web of Data, Linked Data, Semantic Web, Web Ontologies… and all the mess inside

Qui: 
Antoine Zimmermann
Quand: 
Friday, January 14, 2011 - 12:30 to 14:00
Où: 
INSA - Salle de réunion IF

Je donnerai un aperçu de haut niveau des concepts du Web des données, du Web sémantique, des principes des “Linked Data” ainsi que des ontologies du Web en montrant que, tout en favorisant l'interopérabilité, la réutilisabilité et l'échange de données, le développement et le déploiement de ces technologies à large échelle sont encore truffés de pièges et semés d'embuches théoriques et pratiques. J'insisterai tout de même sur les succès – relatifs – accomplis dans ce domaine.

Quelques verrous scientifiques autour de l'email

Qui: 
Romain Vuillemot
Quand: 
Friday, January 7, 2011 - 12:30 to 14:00
Où: 
INSA - Salle réunion LIRIS

L'email est encore aujourd'hui LE moyen de communication, aussi bien dans un cadre personnel qu'en entreprise. Dans le contexte du projet DLM 3.0 (Demain Le Mail 3.0 - http://blog.dlm30.com/), nous allons présenter un bref historique de l'email (créé dès 1974), ainsi que les verrous scientifiques majeurs.

Gestion de l’information dans des systèmes distribués ouverts intégrant des participants autonomes

Qui: 
Philippe Lamarre
Quand: 
Friday, November 5, 2010 - 12:30 to 13:30

Les nouvelles applications rendues possibles par internet et les nouveaux besoins qu’elles engendrent font exploser les volumes d’informations. La prise en charge de cet accroissement très rapide est d’autant plus complexe que les données sont très diverses. Cette diversité est due tant à la nature des données elles-mêmes (texte, multimédia, méta-données, traces) qu’à la manière dont elles sont produites (senseur, personne, groupe de personnes…).

Autorité de certification distribuée pour des réseaux pair-à-pair structurés

Qui: 
François Lesueur
Quand: 
Wednesday, April 14, 2010 - 14:00 to 15:00

Les systèmes pair-à-pair permettent de concevoir des systèmes de très grande taille à forte disponibilité, tout cela à faible coût. Au contraire des clients dans un système de type client-serveur, les pairs d'un réseau pair-à-pair jouent un rôle actif dans le fonctionnement du réseau et fournissent leur bande passante, leur puissance de calcul et leur capacité de stockage. Cependant, la présence de pairs malveillants ou ne se conformant pas au comportement attendu peut rompre le service proposé.

Séminaire R.Thion

Qui: 
Romuald Thion
Quand: 
Monday, April 12, 2010 - 14:00 to 15:00

Les organisations doivent se conformer à de nombreuses règles de droit issues de la loi, de règlements ou d'engagements contractuels.
Toutes ces règles partagent des traits caractéristiques comme la présence de déclencheurs qui les activent, d'échéance où elles sont évaluables ou de sanctions/réparations associées.
Un problème d'intérêt est de vérifier la conformité de ses règles sur des traces issues de l'activité des organisations, dans une perspective d'audit.
Nous avons conçu un langage formel dédié à ces règles, doté d'une sémantique dénotationnelle.

Intégration, optimisation et analyse des flux de données de capteurs

Qui: 
Iulian Sandu Popa
Quand: 
Friday, April 9, 2010 - 14:00 to 15:00

Depuis quelques années les technologies comme le GPS, les capteurs et les systèmes informatiques embarqués connaissent un essor prodigieux. Il existe aujourd’hui d'innombrables applications qui se basent sur ces technologies, e.g., dans les domaines des transports, du climat et de la météorologie, de la santé, de l’énergie, etc.

Using Boolean Equations and Rewriting Systems to solve Datalog Programs

Qui: 
Christophe Joubert
Quand: 
Tuesday, April 6, 2010 - 14:00 to 15:00

In this talk, we present two powerful, fully automated methods to
evaluate Datalog programs: the first approach transforms the Datalog
program in an implicit Boolean Equation Systems (BESs) solved by
existing general purpose verification toolboxes, such as CADP,
providing local BES resolutions with linear-time complexity; the
second approach transforms Datalog programs into Rewriting Logic and
produces an efficient rewrite system exploiting the main features of
the high-level programming language Maude. We confirm our results

Séminaire Ahmed K. Elmagarmid

Qui: 
Ahmed K. Elmagarmid
Quand: 
Tuesday, March 16, 2010 - 14:00 to 15:00

Cyber Infrastructure is the chief enabler for innovation in many of today's most pressing Science and Engineering problems. There are in fact complete areas in Science such as Systems Biology that would not exist if not for a flourishing computing and information discipline. In this presentation we will introduce cyber infrastructure (CI), its chief components, and the transition from being an enhancer for discovery to an enabler. We will then introduce Cyber Communities as a viable way to build new CI for domain sciences.

Une composition dynamique des services pour l'informatique ambiante

Qui: 
Noha Ibrahim
Quand: 
Wednesday, March 3, 2010 - 14:00 to 15:00

L'informatique ambiante est une réalité qui s'impose amenant avec elle des défis majeurs qui touchent à divers domaines comme les intergiciels, les bases de données et les réseaux de communication pour ne citer que ceux là. Une des problématiques majeures de l'informatique ambiante est comment utiliser et surtout composer les services offerts par cette dernière, de manière à répondre aux attentes des usagers. Dans cet exposé, je vais définir et formaliser une composition dynamique des services qui touchent à leur aspects fonctionnels, non fonctionnels et structurels.

Service Computing: Evolution in the Computing Food Chain

Qui: 
Athman Bouguettaya
Quand: 
Tuesday, December 1, 2009 - 14:00 to 15:00

Service-oriented computing aims at providing a foundational computing framework to support a service-centric approach to solve vexing problems of enterprise/Web integration and interoperability. The Web is and will undoubtedly be the preferred delivery platform of targeted service-based solutions. More specifically, Web services are poised to be the key component and enabler of the service-oriented approach for the efficient management of services on the Web.

Seminaire doctorants BD 2eme annee

Qui: 
doctorants BD 2eme annee
Quand: 
Monday, November 23, 2009 - 13:00 to 14:00

13:00 Brice Chardin : Historisation de données et impact des mémoires flash
13:30 Rosa Marina Donolo : Indicateurs spatiaux environnementaux à échelle urbaine : définition, implémentation et visualisation
14:00 François Hantry : High level Business queries
14:30 .... pause
14:45 Roula Karam : Intégration et Visualisation des services LBS provenant de plusieurs fournisseurs
15:15 Marius Massala : Métadonnées géographiques et recherche d'information

Dépendances Fonctionnelles Conditionnelles: une hiérarchie pour le data-mining.

Qui: 
Raoul Medina
Quand: 
Monday, May 11, 2009 - 14:00 to 15:00

Nous montrons la hiérarchie existant entre règles d'associations, dépendances fonctionnelles et dépendances fonctionnelles conditionnelles. Cette hiérarchie est aussi une représentation compacte des règles d'associations.Nous proposons une algorithmique très simple permettant de naviguer dans cette hiérarchie.

Discovery of Probabilistic Mappings between Taxonomies: Principles and Experiments

Qui: 
Rémi Tournaire
Quand: 
Monday, May 4, 2009 - 14:00 to 15:00

Notre but est d'analyser une approche pour définir et découvrir des mappings probabilistes entre deux taxonomies. D'abord, nous comparons 2 façons de modéliser les mappings probabilistes qui sont compatibles avec les contraintes logiques déclarées dans les taxonomies. Nous suivons une démarche bayésienne pour estimer les probabilités des mappings, en exploitant les descriptions des instances associées aux classes des taxonomies.

Métadonnées géographiques et recherche d'information

Qui: 
Marius Massala
Quand: 
Wednesday, February 25, 2009 - 14:00 to 15:00

L’exploitation et l’utilisation croissante des données géographiques a conduit à une augmentation du volume informationnel. Les utilisateurs requièrent donc des outils et méthodes permettant de découvrir, retrouver et gérer les informations disponibles.

Séminaire Cuzzocrea

Qui: 
Alfredo Cuzzocrea
Quand: 
Thursday, January 22, 2009 - 14:00 to 15:00

In this talk, we will present an innovative technique supporting accuracy control in compressed multidimensional data cubes. The proposed technique can be efficiently used in Quality-of-Answer-based OLAP tools, where OLAP users/applications and Data Warehouse servers are allowed to mediate on the accuracy of (approximate) answers, similar to what happens with the quality of services mechanism in QoS-based systems.

Retrospective on Clio: Schema Mapping and Data Exchange

Qui: 
Renée Miller
Quand: 
Monday, January 5, 2009 - 14:00 to 15:00

We present a framework for creating schema mappings between independently developed schemas. In our approach, attribute correspondences (the result of "schema matching") are translated into a set of mappings that capture the semantics of the source and target schemas (including their hierarchical organization as well as referential constraints). These mappings are then translated into queries over the source schema(s) that produce a target instance satisfying the referential constraints and structure of the target schema.

Sémantique des réseaux de connaissances

Qui: 
Antoine Zimmermann
Quand: 
Friday, December 5, 2008 - 14:00 to 15:00

A.Zimmermann (INRIA Exmo, LIG) vient de soutenir sa these avec Jerome Euzenat.

P2P Content Sharing

Qui: 
Serge Abiteboul
Quand: 
Thursday, November 20, 2008 - 14:00 to 15:00

Information ubiquity has created a large crowd of users (e.g. scientists), who can use database technology to process and share their data more effectively. We consider the issue of building content sharing communities in peer-to-peer environments. The users should be able to manage and share their data with minimal effort with the system in charge of indexing it (to make it accessible), replicating it (for availability), and reorganizing its physical storage (for better query performance).

Vers une algèbre relationnelle étendue aux services

Qui: 
Yann Gripay
Quand: 
Monday, October 13, 2008 - 14:00 to 15:00

Interroger des données non-conventionnelles est reconnu comme une problématique majeure dans les nouveaux environnements et applications tels que ceux existant dans l'informatique pervasive. Dans cet article, nous rapportons nos premiers résultats étendant l'algèbre relationnelle pour gérer les données, les flux et les services de manière unifiée. A travers la notion d'attributs virtuels et de binding patterns, une vue orientée données des environnements pervasifs est alors possible.

Une approche de test passif basée sur des invariants. Application au protocole WAP

Qui: 
Fatiha Zaidi
Quand: 
Friday, September 26, 2008 - 14:00 to 15:00

Les techniques de test actives supposent que l’on peut interagir avec le système sous test (SUT). En effet, dans la plupart des cas, l’activité de test est basée sur la capacité d’un testeur à stimuler l’implantation sous test, et vérifier les réponses provenant de ce SUT. Cependant dans certaines situations, cette ac- tivité devient difficile et même souvent impossible à réaliser. Pour faire face à de telles situations, des techniques dites de test passif ont été proposées. Elles n’ont pas besoin d’interagir avec le SUT.

Séminaire Ait Kacit

Qui: 
Hassan Ait Kacit
Quand: 
Tuesday, June 24, 2008 - 14:00 to 15:00