dc.creator | Rodrigues, Fillipe | |
dc.date.accessioned | 2016-02-18T19:20:17Z | |
dc.date.available | 2015-02-20 | |
dc.date.available | 2016-02-18T19:20:17Z | |
dc.date.issued | 2015-02-20 | |
dc.identifier.uri | http://memoria.ifrn.edu.br/handle/1044/757 | |
dc.description.abstract | The techniques of Machine Learning are applied in classification tasks to acquire
knowledge through a set of data or information. Some learning methods proposed in
literature are methods based on semissupervised learning; this is represented by small
percentage of labeled data (supervised learning) combined with a quantity of label and
non-labeled examples (unsupervised learning) during the training phase, which reduces,
therefore, the need for a large quantity of labeled instances when only small dataset of
labeled instances is available for training. A commom problem in semi-supervised
learning is as random selection of instances, since most of paper use a random selection
technique which can cause a negative impact. Much of machine learning methods treat
single-label problems, in other words, problems where a given set of data are associated
with a single class; however, through the requirement existent to classify data in a lot of
domain, or more than one class, this classification as called multi-label classification.
This work presents an experimental analysis of the results obtained using
semissupervised learning in troubles of multi-label classification using reliability
parameter as an aid in the classification data. Thus, the use of techniques of
semissupervised learning and besides methods of multi-label classification, were essential
to show the results. | pt_BR |
dc.description.sponsorship | CNPq | pt_BR |
dc.language | por | pt_BR |
dc.publisher | Instituto Federal de Educação, Ciência e Tecnologia do Rio Grande do Norte | pt_BR |
dc.rights | Acesso Aberto | pt_BR |
dc.subject | Aprendizado de Máquina | pt_BR |
dc.subject | Aprendizado Semissupervisionado | pt_BR |
dc.subject | Classificação Multirrótulo | pt_BR |
dc.subject | Parâmetro de Confiabilidade | pt_BR |
dc.title | Uso de confiabilidade na rotulação de exemplos em problemas de classificação multirrótulo com aprendizado semissupervisionado | pt_BR |
dc.title.alternative | USO DE CONFIABILIDADE NA ROTULAÇÃO DE EXEMPLOS EM PROBLEMAS DE CLASSIFICAÇÃO MULTIRRÓTULO COM APRENDIZADO SEMISSUPERVISIONADO | pt_BR |
dc.type | Dissertação | pt_BR |
dc.creator.Lattes | http://lattes.cnpq.br/4214726460957461 | pt_BR |
dc.contributor.advisor1 | Canuto, Anne | |
dc.contributor.advisor1Lattes | http://lattes.cnpq.br/1357887401899097 | pt_BR |
dc.contributor.advisor-co1 | Santos, Araken | |
dc.contributor.advisor-co1Lattes | http://lattes.cnpq.br/8059198436766378 | pt_BR |
dc.publisher.country | Brasil | pt_BR |
dc.publisher.department | Parnamirim | pt_BR |
dc.publisher.program | Outro | pt_BR |
dc.publisher.program | PROGRAMA DE PÓS-GRADUAÇÃO EM SISTEMAS E COMPUTAÇÃO | pt_BR |
dc.publisher.program | Outro | pt_BR |
dc.publisher.initials | IFRN | pt_BR |
dc.subject.cnpq | Ciência da Computação | pt_BR |
dc.subject.cnpq | Inteligência Artificial | pt_BR |
dc.description.resumo | As técnicas de Aprendizado de Máquina são aplicadas em tarefas de classificação para a
aquisição de conhecimento através de um conjunto de dados ou informações. Alguns
métodos de aprendizado utilizados pela literatura são baseados em aprendizado
semissupervisionado; este é representado por pequeno percentual de exemplos rotulados
(aprendizado supervisionado) combinados com uma quantidade de exemplos rotulados e
não rotulados (não-supervisionado) durante a fase de treinamento, reduzindo, portanto, a
necessidade de uma grande quantidade de dados rotulados quando apenas um pequeno
conjunto de exemplos rotulados está disponível para treinamento. O problema da escolha
aleatória das instâncias é comum no aprendizado semissupervisionado, pois a maioria dos
trabalhos usam a escolha aleatória dessas instâncias o que pode causar um impacto
negativo. Por outro lado, grande parte dos métodos de aprendizado de máquina trata de
problemas unirrótulo, ou seja, problemas onde exemplos de um determinado conjunto são
associados a uma única classe. Entretanto, diante da necessidade existente de classificar
dados em uma grande quantidade de domínios, ou em mais de uma classe, essa
classificação citada é denominada classificação multirrótulo. Este trabalho apresenta uma
análise experimental dos resultados obtidos por meio da utilização do aprendizado
semissupervisionado em problemas de classificação multirrótulo usando um parâmetro de
confiabilidade como auxílio na classificação dos dados. Dessa maneira, a utilização de
técnicas de aprendizado semissupervisionado, bem como de métodos de classificação
multirrótulos, foram imprescindíveis na apresentação dos resultados | pt_BR |