Vou colocar um exemplo maior.
\usepackage{float} % controla e define objetos flutuantes
\usepackage{cancel} % permite cancelar termo (risco transversal) em equações
\usepackage{listings} % controla novos ambientes que listam índices, e.g. lista de anexos
\usepackage{boxedminipage} % texto em caixas
\usepackage{tikz} % permite desenhos vetoriais
\usetikzlibrary{shapes,arrows} % aceesórios
% Definir ambiente numerado de qualquer coisa, e.g. lista de anexos =====================================
\usepackage{tocloft}
\usepackage{fncychap}
\renewcommand{\baselinestretch}{1.5cm} % redefine o espaçamento entre linhas
\makeatletter % permite leitura do caracter @ nas definições que seguem
\def\onehalspacing{1.5}
\renewcommand{\section}{\@startsection
{section}% % the name
{1}% % the level
{0mm}% % the indent
{-\baselineskip}% % the before skip
{1.\baselineskip}% % the after skip
{\noindent\normalsize\textbf}} % the style
\renewcommand{\subsection}{\@startsection
{subsection}% % the name
{2}% % the level
{0mm}% % the indent
{-\baselineskip}% % the before skip
{0.5\baselineskip}% % the after skip
{\noindent\normalsize\textbf}} % the style
%
\def\l@section{\@dottedtocline{1}{0em}{4em}}
% definir a profundidade do índice
\setcounter{tocdepth}{2}
\renewcommand{\baselinestretch}{1.2} % espaçamento entre linha
\renewcommand{\figurename}{FIGURA}
\numberwithin{equation}{section} % numerar equação por seção
% definindo a profundidade da identação
\setlength{\parindent}{1.25cm}
% Para configurar o footnote ============================================================================
\usepackage[symbol, hang, flushmargin]{footmisc}
% Comandos personalizados para palavras, réguas, etc. ===================================================
\newcommand{\lin}{\noindent \rule[4mm]{\textwidth}{0.1ex}} % régua horizontal
% Comandos personalizados para palavras, réguas, etc. ===================================================
% Contador criado para enumerar rotinas do R ============================================================
\newcounter{Rotinacount} % criando um novo contador de estruturas
\setcounter{Rotinacount}{0} % configurando o novo contador de estruturas para começar do zero
\newenvironment{rotina} % para chamar \begin{rotina}...
{\stepcounter{Rotinacount}{\noindent\bf Rotina} % se quiser ponto "." coloque atrás de "rotina"
\textbf{\arabic{Rotinacount}:} % os ":" definem o simbolo que acompanha o número contador
\begin{it}
}
{\end{it}
}
% Contador criado para enumerar rotinas do R ============================================================
% Configurações de cores personalizadas =================================================================
\definecolor{verde}{rgb}{0.50,1.00,0.00}
\definecolor{vermelho_forte}{rgb}{0.38,0.00,0.00}
\definecolor{roxo}{rgb}{0.50,0.00,0.50}
\definecolor{Myblue}{cmyk}{1,1,0,0}
\definecolor{Mygreen}{rgb}{0.1,0.8,0.5}
\definecolor{Mygreen2}{cmyk}{1,0,1,0.5} % ciano,majenta,yellow,black
\definecolor{Mygrey}{gray}{0.75}
\usepackage{times}
%%\usepackage{eulervm}
\usepackage[scaled=0.85]{beramono} % usa esta nos verbatins [scaled=0.9]
\usepackage{layouts}
% configurações do fancyhdr para cabeçalhos e rodapé ====================================================
\usepackage{fancyhdr}
%\pagestyle{fancy}
%\lhead{} % cabeçalho esquerdo
%\chead{} % cabeçalho central
%\rhead{\thepage} % cabeçalho direito, \bfseries é de boldfont, negrito
%\lfoot{} % rodapé esquerdo {Zeviani, W.M.}
%\cfoot{} % rodapé central
%\rfoot{} % rodapé direito, \thepage é o número da página
% configurações do hyperref para bookmarks em PDF =======================================================
\usepackage{hyperref} %transformas o sumário e as citações em hiperlinks
\hypersetup{
% bookmarks=true, % show bookmarks bar?
% unicode=false, % non-Latin characters in Acrobat’s bookmarks
% pdftoolbar=true, % show Acrobat's toolbar?
% pdfmenubar=true, % show Acrobat's menu?
% pdffitwindow=true, % page fit to window when opened
pdftitle={Biblioteca R para a análise bayesiana de dados categorizados usando modelos mistos de
limiar}, % title
pdfauthor={Fábio Mathias Corrêa}, % author
pdfsubject={Tese de Doutorado}, % subject of the document
pdfcreator={GVim+Sweave}, % creator of the document
pdfproducer={FMC}, % producer of the document
pdfkeywords={thresholds, modelos mistos}, % list of keywords
%pdfnewwindow=true, % links in new window
colorlinks=true, % false: boxed links; true: colored links
linkcolor=black, %Mygreen2, % color of internal links
citecolor=black, %Myblue, % color of links to bibliography
filecolor=red, % color of file links
urlcolor=cyan % color of external links
}
% configurações do hyperref para bookmarks em PDF =======================================================
%++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++
%+++++++++++++++++++++++++++++ Aqui começa o documento +++++++++++++++++++++++++++++++++%
%+++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++%
\title{Biblioteca R para a análise bayesiana de dados categorizados usando modelos mistos de limiar}
\author{Fábio Mathias Corrêa}
\date{}
\begin{document}
\tocloftpagestyle{empty}
%=========================================================================================================================================%
%==================================== CAPA CAPA CAPA CAPA ====================================%
%=========================================================================================================================================%
\section*{}
\pagestyle{empty}
\vspace{-0.5cm}
\begin{singlespace}
\begin{center}
\includegraphics[scale=0.35]{logo-ufla}\\ \vspace{0.6cm}
\Large{\textbf{FÁBIO MATHIAS CORRÊA}}
\end{center}
\end{singlespace}
\vspace{4cm}
\begin{singlespace}
\begin{center}
\Large{\textbf{BIBLIOTECA R PARA A ANÁLISE BAYESIANA DE DADOS CATEGORIZADOS USANDO MODELOS MISTOS DE
LIMIAR}}
\end{center}
\end{singlespace}
%\vspace{5cm}
\vfill
\begin{center}
\Large{\textbf{LAVRAS - MG}}\\
\Large{\textbf{2013}}
\end{center}
%==========================================================% folha de rosto ===============================================================
\newpage
\section*{}
\vspace{-0.7cm}
\centerline{\textbf{FÁBIO MATHIAS CORRÊA}}
\vspace{1.4cm}
\begin{singlespace}
\begin{center}
\textbf{BIBLIOTECA R PARA A ANÁLISE BAYESIANA DE DADOS CATEGORIZADOS USANDO MODELOS MISTOS DE LIMIAR}
\end{center}
\end{singlespace}
\vspace{1cm}
\begin{flushright}
\begin{minipage}{8.5cm}
\begin{quote}
\begin{singlespace}
Tese apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em
Estatística e Experimentaç\~ao, \'area de concentra\c c\~ao Estatística e Experimenta\c c\~ao
Agropecu\'aria para a obtenção do título de doutor.
\end{singlespace}
\end{quote}
\end{minipage}
\end{flushright}\vspace{1.1cm}
\begin{singlespace}
\begin{center}
\noindent Orientador\\
\noindent Dr. Júlio Silvio de Sousa Bueno Filho
\end{center}
\end{singlespace}
\begin{center}
\begin{singlespace}
\vfill
\centerline{\textbf{LAVRAS - MG}}\vspace{0.2cm}
\centerline{\textbf{2013}}
\end{singlespace}
\end{center}
%======================================================== ficha catalográfica=============================================================
\newpage
\textcolor{white}{fantasma}
\vfill
\begin{center}
\begin{singlespace}
\large{\textbf{Ficha Catalográfica Preparada pela Divisão de Processos Técnicos da Biblioteca da UFLA}}\vspace{0.1cm}
\end{singlespace}
\end{center}
\begin{center}
\begin{boxedminipage}{12.5cm}
\begin{singlespace}
\begin{center}
\hspace*{0.8cm}
\begin{tabular}{p{11cm}}
\vspace{0.5cm} \noindent{Corrêa,Fábio Mathias.}\\
\hspace*{0.5cm} Biblioteca R para a análise bayesiana de dados categorizados \\ usando modelos mistos de limiar\\
Fábio Mathias Corrêa. -- Lavras : UFLA, \\ 2013.\\
\hspace*{0.5cm} 82 p. : il.
\vspace{0.4cm}
\hspace{0.5cm} Tese (Doutorado) -- Universidade Federal de Lavras, 2012.\\
\hspace{0.5cm} Orientador: Júlio Silvio de Sousa Bueno Filho.\\
\hspace{0.5cm} Bibliografia.
\vspace{0.4cm}
\hspace{0.5cm} 1. Bayesthresh. 2. Modelos mistos. 3. Thresholds. I. Universidade Federal de Lavras. II. Título.\\
\multicolumn{1}{r}{}\\
\multicolumn{1}{r}{CDD -- 639.3758}
\end{tabular}
\end{center}
\end{singlespace}
\end{boxedminipage}
\end{center}
%======================================================== página de aprovação==============================================================
\newpage
\section*{}
\vspace{-0.7cm} \centerline{\textbf{FÁBIO MATHIAS CORRÊA}}
\vspace{0.5cm}
\begin{singlespace}
\begin{center}
\textbf{BIBLIOTECA R PARA A ANÁLISE BAYESIANA DE DADOS CATEGORIZADOS USANDO MODELOS MISTOS DE LIMIAR}
\end{center}
\end{singlespace}
\vspace{0.3cm}
\begin{flushright}
\begin{minipage}{9.6cm}
\begin{quote}
\begin{singlespace}
Tese apresentada à Universidade Federal de Lavras, como parte das exigências do Programa de Pós-Graduação em
Estatística e Experimentaç\~ao, \'area de concentra\c c\~ao Estatística e Experimenta\c c\~ao
Agropecu\'aria para a obtenção do título de doutor.
\end{singlespace}
\end{quote}
\end{minipage}
\end{flushright}
\vspace{1cm}
APROVADA em 14 de Novembro de 2012\vspace{0.2cm} \\
Dr. Edwin Moises Marcos Ortega \hfill Esalq-USP \vspace{0.18cm} \\
Dr. Eric Batista Ferreira \hfill UNIFAL \vspace{0.18cm} \\
Dr. Renato Nunes de Lima \hfill UFLA \vspace{0.18cm}\\
Dra. Thelma Sáfadi \hfill UFLA\vspace{0.18cm} \\
\begin{center}
\begin{singlespace}
\vspace{0.5cm}
\centerline{Dr. Júlio Silvio de Sousa Bueno Filho}\vspace{0.2cm}
\centerline{Orientador}
%\vspace{1cm}
\vfill
\centerline{\textbf{LAVRAS - MG}}
\centerline{\textbf{2013}}
\end{singlespace}
\end{center}
%=========================================================================================================================================%
%============================= CAPA CAPA CAPA CAPA ===========================%
%==========================================================================================================================================
%=========================================================================================================================================%
%======================= DEDICATÓRIA DEDICATÓRIA ======================%
%=========================================================================================================================================%
% \newpage
% \vspace{0.5cm}
%
% \section*{}
% \vspace{0.5cm}
%
% \emph{\textbf{Aos amantes da estatística}\\
%
%===========================================================================================================================================%
%============================== DEDICATÓRIA DEDICATÓRIA ===========================%
%===========================================================================================================================================%
%===========================================================================================================================================%
%==================================== AGRADECIMENTOS AGRADECIMENTOS ====================%
%===========================================================================================================================================%
\newpage
\begin{center}
\textbf{AGRADECIMENTOS}
\end{center}
\vspace{0.5cm}
\`A minha companheira e esposa Raquel, que se sempre esteve ao meu lado e que carrega em seu ventre o mais
novo membro da fam\'ilia. Meu muito obrigado!
\`A minha filha Maria Clara Mello Corr\^ea (MCMC), que me enche de alegria e que deu um novo
significado a sigla MCMC;
Ao filh\~ao Jo\~ao Gabriel que est\'a, ainda, no ventre de sua m\~ae, mas j\'a nos enche de
alegrias;
Ao Prof. Julio Sílvio de Sousa Bueno Filho, pela orientação, amizade e paciência durante estes anos;
Aos amigos Ivan e Fernanda, pela amizade e convivência;
Aos amigos Manoel, Luciana e Dona Abigail por, toda amizade e companheirismo;
Aos amigos Brou, Wyzy, Rose e Deyse, pelo convívio e por todos os momentos bons que passamos;
Ao grupo de discussão R\_br, por toda a colaboração;
Aos professores do DEX-UFLA pelo aux\'ilio na minha formaç\~ao;
Ao Prof. Daniel Furtado Ferreira, pelas boas conversas que tivemos;
À Universidade Federal de Lavras e ao Departamento de Ciências Exatas;
Ao CNPq, pelo apoio financeiro;
E a todos aqueles que, de forma direta ou indireta, contribuíram para meu êxito pessoal e profissional.
%===========================================================================================================================================%
%========================== EPÍGRAFE ====================================%
%============================================================================================================================================
% \newpage
% \begin{flushright}
% \begin{minipage}{10cm}
% \vspace{15cm}
% \begin{singlespace}
% ``\textit{\textbf{Não basta nascer, crescer, desenvolver e morrer, o propósito de viver é bem maior do que isso!!}}''
% \end{singlespace}
% \end{minipage}
% \end{flushright}
%
%===========================================================================================================================================%
%================================== RESUMO ABSTRACT RESUMO ABSTRACT ======================%
%===========================================================================================================================================%
\newpage
\begin{singlespace}
\begin{center}
\section*{RESUMO} %\textbf{RESUMO}
\end{center}
Nesta tese avaliamos os algoritmos para a análise bayesiana de modelos mistos em dados
categorizados ordinais, bem como a sua implementação na biblioteca Bayesthresh para o ambiente de programação R.
O pacote Bayesthresh apresenta uma estrutura flexível para inserção de modelos
mistos e utiliza-se do processos de Monte Carlo via Cadeias Markov (MCCM) para
obtenção das aproximações numéricas das distribuições a posteriori para os parâmetros do modelo.
O estudo sobre a eficiência dos algoritmos implementados no pacote avaliou o tempo de processamento, a
dependência das cadeias MCCM geradas e efeitos de sensibilidade a especificação das distribuições "a priori" para
as componentes da variância. Adicionalmente foram calculados os erros (viés e Erro Quadrático Médio - EQM) das
estimativas a posteriori obtidas para os efeitos fixos, efeitos aleatórios e componentes da variância. Um exemplo é apresentado
de um experimento com variedades de tomateiro cujo objetivo é a seleção para a resistência à requeima causada pelo
fungo Phytophthora infestans. Os algoritmos descritos por Nandram e Chen (1996) e sua modificação para a introdução
da distribuição t para o traço latente foram os mais rápidos e precisos, porém, para experimentos simulados com
correlação intraclasse igual a 0.8 (valor alto na prática), estes algoritmos tenderam a superestimar esta correlação.
Na ilustração são apresentadas estimativas úteis para a seleção de variedades bem como o equivalente bayesiano
de um teste para decidir se o traço latente tem distribuição gaussiana, não encontrando evidências em contr\'ario.
Em artigo adicional explora-se a utilização da ferramenta construída com exemplos de possibilidades de análise.
Nesta ilustração foi analisado um experimento sensorial de conservas de banana desidratadas sob
diferentes concentrações de açúcar, descrito por Silva (2008).
% Estamos apresentando uma implementa\c c\~ao dos algoritmos descritos por Albert e Chib (ACG e ACt), Cowles (MCG e MCt)
% e Nandram e Chen (NCG e NCt) em forma de um pacote, denominado Bayesthresh, para uso no software R.
% O pacote Bayesthresh apresenta uma estrutura flexível para inser\c c\~ao de modelos mistos utilizando processos
% de Monte Carlo via Cadeias Markov (MCCM) para obten\c c\~ao das estimativas dos par\^ametros do modelo. \'E
% apresentado tamb\'em um estudo sobre a efici\^encia dos algoritmos implementados no pacote Bayesthresh quanto ao
% tempo de processamento, depend\^encia da cadeia gerada no processo de amostragem e efeito da priori para os efeitos
% aleat\'orios e vari\^ancia residual no erro das estimativas obtidas para os efeitos fixos, aleat\'orios e
% componentes da vari\^ancia. Foi realizado tamb\'em, um estudo em uma popula\c c\~ao de tomates
% visando a sele\c c\~ao quanto a resist\^encia a Phytophthora infestans utilizando os algoritmos
% implementados no pacote Bayesthresh e os efeitos de duas prioris diferentes nas estimativas dos componentes
% da vari\^ancia. Os algoritmos descritos por Nandram e Chen apresentaram menor tempo de processamento e
% menor depend\^encia da cadeia gerada pelo processo MCCM. Quanto ao erro nas estimativas dos efeitos fixos, aleat\'orios
% e componentes de vari\^ancia, os algoritmos de Nandram e Chen para experimentos cujo interesse reside nos efeitos
% fixos, apresentaram menor erro quadr\'atico m\'edio para as estimativas avaliadas, por\'em, para delineamentos
% cujo o interesse est\'a nas estimativas dos componentes da vari\^ancia, para valores de alta correla\c c\~ao
% intraclasse, maior que 0.8, estes algororitmos necessitam de prioris adequadas para minimizar o erro da estimativa.
% No estudo de aplica\c c\~ao, todos os algoritmos se mostraram eficientes para uso em sele\c c\~ao de gen\'otipos de
% tomate com resist\^encia a P. infestans.
\noindent Palavras-chave: Análise bayesiana. Análise threshold. Biblioteca R. Modelos mistos. MCCM
\end{singlespace}
\newpage
\begin{singlespace}
\begin{center}
\section*{ABSTRACT} %\textbf{ABSTRACT}
\end{center}
In this thesis we evaluate algorithms for Bayesian analysis of ordinal categorical data as well as their
implementation in the library Bayesthresh for the R statistical programing environment. Bayesthresh
package has a flexible structure to insert mixed models and uses Markov Chain Monte Carlo (MCMC)
sampling to approximate posterior distributions for model parameters. Simulation study of the efficiency of the
algorithms considered processing time, dependency in the MCMC sampling chains and sensitivity to prior
specifications for the variance components. Mean Squared Error (MSE) and average Bias in the marginal
posterior distributions where also evaluated. An example is discussed from a breeding experiment for resistance
to late blight (Phytophthora infestans) in varieties of tomato. Algorithms described by Nandran and Chen (1996)
and derived algorithms were the faster and more accurate, although slightly overestimating intraclass correlation
($\rho$) in experiments with higher parametric values ($\rho=0.8$).
In the example useful estimates for plant breeding are presented, as Bayes factor test to decide on latent trait
having Gaussian distribution. Gaussian distribution was as likely as Student's t distribution. An additional
paper explores the uses of the modeling tool with an example from sensory analysis of dehydrated banana candy recipes
with different sugar content, described by Silva (2008).
%
%
% We are presenting an implementation of the algorithms described by Albert and Chib (ACG and ACt), Cowles (MCG and MCT)
% and Nandram and Chen (NCG and NCT) in the form of a package Bayesthresh for use in software R. The package provides
% a flexible Bayesthresh for inserting models Mixed using methods of Monte Carlo Markov Chain (MCMC) for obtain
% estimates of the model parameters. It is also presented a study on the efficiency of the algorithms implemented
% in the package Bayesthresh as the processing time, dependency chain generated in the process Sampling and effect
% of the prior for the random effects and residual variance the error of the estimates for the fixed effects, and
% random effects and variance components. It was also performed a study in a population of tomatoes aiming
% selecting for resistance to Phytophthora infestans using the algorithms Bayesthresh implemented in the package
% and the effects of two different priors on estimates of variance components. The algorithms described by
% Nandram and Chen showed less processing time and lower dependence on MCMC chain generated by the process. As for
% the error in estimates of the fixed and random effects and variance components, algorithms and Nandram and Chen
% for experiments whose interest lies in the fixed effects, errors are smaller mean squared error for estimates
% evaluated, however, whose designs for interest is the estimates of the components of the variance, for values of
% high intraclass correlation coefficient greater than 0.8, these algorithm require appropriate priors for minimize
% the error of the estimate. In the application study, all algorithms have proved effective for use in
% selection of genotypes of the tomato with resistance to P. infestans.
\noindent Keywords: Bayesian analysis. Mixed models. R package. Threshold models. MCMC
\end{singlespace}
%===========================================================================================================================================%
%============================== SUMÁRIO SUMÁRIO SUMÁRIO SUMÁRIO ===========================%
%=============================================================================================================================================================================
\newpage
\cftpagenumbersoff{subsection}
\begin{center}
\vspace*{0.3cm}
\renewcommand{\contentsname}{\normalsize{SUMÁRIO}}
\tableofcontents\thispagestyle{empty}
% gera o índice
\end{center}
%============================================================== PRIMEIRA PARTE ============================================================%
\addcontentsline{toc}{subsection}{\hspace{1cm}\textbf{PRIMEIRA PARTE}}
%===========================================================================================================================================%
%================================= INTRODUÇÃO INTRODUÇÃO INTRODUÇÃO ====================
%============================================================================================================================================
\newpage
\pagestyle{fancy}
\rhead{\small \thepage}
\cfoot{} % rodapé central
\renewcommand{\headrulewidth}{0mm}
\section*{PRIMEIRA PARTE}
\section*{1 INTRODUÇÃO}
\addcontentsline{toc}{section}{\textbf{1}\hspace{1.4cm}\textbf{INTRODUÇÃO}}
%
Variáveis discretas s\~ao classificadas como ordinais quando os seus níveis podem ser ordenados de forma a
representar algum tipo de mensura\c c\~ao, como por exemplo, a escala de dureza de um mineral, que varia de
1 a 10, escalas diagram\'aticas utilizadas para avalia\c c\~ao da severidade de doen\c cas de
plantas, notas de escore corporal de animais e a escala hed\^onica utilizada em an\'alise sensorial
de alimentos. Durante o s\'eculo passado, a forma mais comum de análise prática deste tipo de variável
foi a aproxima\c c\~ao normal ap\'os transforma\c c\~oes que preservassem grosseiramente sua
escala. Recentemente, diversas metodologias de an\'alises para dados categorizados ordinais s\~ao propostas,
tanto no \^ambito da infer\^encia Bayesiana com os modelos hierárquicos,
quanto no \^ambito da infer\^encia fiducial com os modelos generalizados mistos. \'E
crescente a percepç\~ao de que os modelos com efeitos aleatórios têm melhores propriedades explicativas em
experimentos planejados.
% Os modelos lineares, não lineares e generalizados mistos, bem como dos modelos hierárquicos
% bayesianos propiciaram novas e versáteis ferramentas de modelagem, implementadas em pacotes estatísticos como
% o \cite{R2120}. O mesmo n\~ao se deu com os modelos para dados categorizados ordinais, quando se considera mais
% de duas classes na vari\'avel resposta.
% Dentre as diversas metodologias propostas, os modelos lineares generalizados mistos s\~ao considerados
% os mais flex\'iveis para a análise de dados categorizados \citeonline{BC:1993}. Modelos mistos s\~ao considerados
% flexíveis, pois permitem modelar a correla\c c\~ao dentro do grupo avaliado, pelo tratamento de dados balanceados
% e desbalanceados em uma estrutura unificada, possibilita estimar os par\^ametros da distribui\c c\~ao
% dos efeitos aleat\'orios e calcular os preditores das realiza\c c\~oes dos efeitos aleat\'orios
% \citeonline{Pinheiro:Bates, Mc+Searle:2001}.
Generaliza\c c\~oes de efeitos aleat\'orios para vari\'aveis n\~ao Gaussianas apresentam complica\c c\~oes
matem\'aticas quanto ao processo de integra\c c\~ao utilizado para estimar seus efeitos.
Uma forma de contornar o problema de integra\c c\~ao \'e o uso dos m\'etodos de Monte Carlo via
Cadeias Markov (MCMC). O uso destes algoritmos em análises de rotina \'e dificultado pela pouca
disponibilidade de softwares que possuem
os mesmos implementados. O pacote MCMCglmm \citep{MCMCglmm} disponível para o software R (R DEVELOPMENT CORE TEAM, 2012) possui
o algoritmo proposto por \citep{Cowles:1996} para uso. Por\'em, n\~ao foi realizado nenhum estudo que
avalie a efici\^encia dos algoritmos propostos por \citeonline{Albert+Chib:1993},
\citeonline{Sorensen+Andersen+Gianola+Korsgaard:1995}, \citeonline{Cowles:1996} e \citeonline{NC} e as extens\~oes
proposta por \citeonline{ZW}.
% , para vari\'aveis categóricas ordinais, podemos
% encontrar na literatura, algoritmos para an\'alise de modelos de efeitos fixos e de modelos mistos utilizando
% os processos MCMC para obter as estimativas dos par\^ametros do modelo
% \citeonline{Albert+Chib:1993, Cowles:1996, NC, ZW, Poon+Wang:2011}.
% Dentre os algoritmos que utilizam os processos MCMC para dados categorizados, temos, inicialmente os algoritmos
% propostos por \cite{Albert+Chib:1993} utilizando o processo de amostragem de Gibbs para obter as estimativas
% dos par\^ametros do modelo
% \cite{Albert+Chib:1993} propuseram inicialmente a amostragem de Gibbs para a obten\c c\~ao da distribui\c c\~ao
% marginal dos par\^ametros do modelo utilizando a distribui\c c\~ao t-Student acumulada.
% \cite{Sorensen+Andersen+Gianola+Korsgaard:1995} adaptaram o modelo proposto por \cite{Albert+Chib:1993}, por\'em,
% utilizando a distribui\c c\~ao normal acumulada como fun\c c\~ao de liga\c c\~ao. Um problema evidenciado por
% \cite{Sorensen+Andersen+Gianola+Korsgaard:1995} neste algoritmo \'e a forte autocorrela\c c\~ao entre as estimativas
% geradas no processo de amostragem de Gibbs, comprometendo o tempo de processamento devido a necessidade de
% obten\c c\~ao de longas cadeias. Na tentativa de amenizar a forte autocorrela\c c\~ao, \cite{Cowles:1996}
% prop\^os um algoritmo que a atualiza\c c\~ao dos par\^ametros de limiar \'e feita de forma a aceitar ou n\~ao todo
% o vetor de par\^ametros, utilizando a amostragem de Gibbs com um passo de Metropolis-Hastings. Apesar do
% algoritmo proposto por \cite{Cowles:1996} apresentar melhores propriedades de converg\^encia que os algoritmos
% propostos por \cite{Albert+Chib:1993} e \cite{Sorensen+Andersen+Gianola+Korsgaard:1995}, a vari\^ancia
% da distribui\c c\~ao geradora de candidatos para a vari\'avel latente \'e de difícil obten\c c\~ao.
%
% Devido a dificuldade de obten\c c\~ao da vari\^ancia para a distribui\c c\~ao geradora de candidatos para os
% par\^ametros de limiar e a fim de melhorar o processo de amostragem, com a redu\c c\~ao da autocorrela\c c\~ao
% entre as amostras, \cite{NC} propuseram um algoritmo para amostrar par\^ametros associados aos de
% limiar limitados entre 0 e 1, tendo como fun\c c\~ao geradora de candidatos para tais par\^ametros a distribui\c c\~ao
% de Dirichlet e
% a distribui\c c\~ao Gaussiana para a vari\'avel latente. \cite{ZW:tese} prop\^os uma adapta\c c\~ao
% ao algoritmo de \cite{NC} para aplica\c c\~ao em modelos mistos e extendeu seu uso com a distribui\c c\~ao t-Student
% para a vari\'avel latente e n\~ao observou evid\^encias de que a distribui\c c\~ao t-Student melhore o processo
% de estima\c c\~ao em rela\c c\~ao a distribui\c c\~ao Gaussiana ao avaliar atributos sensoriais de banana.
%
Visando facilitar o uso desta metodologia, objetivou-se com a presente tese de doutoramento avaliar
a efici\^encia dos algoritmos
existentes para análises de modelos mistos em dados categorizados e implementar um pacote para uso no ambiente de
programa\c c\~ao estatística R que apresente uma estrutura flex\'ivel para a inser\c c\~ao de
modelos mistos.
% com os algoritmos propostos por \cite{Albert+Chib:1993}, \cite{Sorensen+Andersen+Gianola+Korsgaard:1995}, \cite{Cowles:1996}, \cite{NC} e \cite{ZW}.
% Um obejtivo maior \'e facilitar o uso desta metodologia em análises de rotina e para tanto
% apresentar o uso da biblioteca.
% No capítulo que se segue será apresentado um estudo sobre a efici\^encia dos algoritmos quanto ao processo
% de converg\^encia e erro na obten\c c\~ao das estimativas dos par\^ametros do modelo em dois delineamentos
% diferentes em situa\c c\~oes experimentais simuladas e a análise de um experimento de avalia\c c\~ao de
% genótipos de tomate resistentes a Phytophthora infestans. O terceiro capítulo disponibiliza um manual de uso
% do pacote Bayesthresh (disponível em:
% no segundo capítulo para uso em \citeonline{R2120} e apresenta com um exemplo, esclarecimentos de sua
% utiliza\c c\~ao pelo usu\'ario final.
% Modelos lineares generalizados mistos \'e uma flex\'ivel ferramenta para an\'alise de dados, cuja a vari\'avel
% resposta n\~ao apresenta distribui\c c\~ao Gaussiana. Uma estrat\'egia para obten\c c\~ao das estimativas
% do modelo \'e o uso do processo de amostragem baseado em Monte Carlo via Cadeias Markov, que atrav\'es de
% distribui\c c\~oes marginais podemos estimar os par\^ametros do modelo. Para o presente processo, h\'a descrito
% na literatura, tr\^es algoritmos, cujo in\'icio foi com o trabalho apresentado por Albert e Chib que tem como
% problema a forte autocorrela\c c\~ao das amostras geradas pelo processo de amostragem. Cowles, para reduzir
% a autocorrela\c c\~ao do algoritmo apresentado por Albert e Chib, prop\^os a aceita\c c\~ao ou n\~ao de todo o vetor
% de par\^ametros de limiar, o que n\~ao ocorre no algoritmo de Albert e Chib, que aceita de forma isolada os elementos
% do vetor. J\'a Nandram e Chen propuseram um algoritmo que utiliza a distribui\c c\~ao de Dirichlet para os
% par\^ametros de limiar, a qual \'e conjugada da distribui\c c\~ao multinomial ficando os $thresholds$ limitados entre
% zero a um.
%
% O principal entrave para o uso destes algoritmos em an\'alises de rotina, \'e a depend\^encia da cadeia gerada
% no processo de amostragem, que acarreta em aumento no n\'umero das amostras, tornando o processo mais lento. Outro
% fator que gera dificuldades no uso dos algoritmos, \'e a pouca disponibilidade de softwares que permitem o uso
% dos mesmos nas an\'alises e a aus\^encia de informa\c c\~oes sobre o desempenho dos algoritmos em diversas
% situa\c c\~oes experimentais.
%
% Visando permitir o uso desta metodologia em an\'alises de rotina e obter maiores informa\c c\~oes sobre os
% algoritmos dispon\'iveis na literatura, quanto ao processo de amostragem e erro nas estimativas apresentadas
% pelos algoritmos, a presente tese foi dividida em dois artigos. O primeiro artigo discute o processo de
% amostragem, avaliando a depend\^encia da cadeia, o tempo de processamento e o erro nas estimativas dos
% efeitos fixos, aleat\'orios e componentes da vari\^ancia, sendo apresentado tamb\'em um exemplo de aplica\c c\~ao
% na sele\c c\~ao de gen\'otipos de tomate resistentes a Phytophthora infestans. O segundo cap\'itulo apresenta
% um manual de uso do pacote Bayesthresh, que \'e uma implementa\c c\~ao dos algoritmos de Albert e Chib, Cowles e
% Nandram e Chen para uso no software R em an\'alises de rotina.
%
%=========================================================================================================================================%
%================================= REFERENCIAL TEÓRICO =========================================%
\newpage
\section*{2 REFERENCIAL TEÓRICO}
\addcontentsline{toc}{section}{\textbf{2}\hspace{1.4cm}\textbf{REFERENCIAL TEÓRICO}}
% \subsection*{2.1 Vari\'aveis categ\'oricas ordinais}
%
%
Vari\'aveis ordinais representam uma escala de grandeza, sendo expressa por valores inteiros, de
forma que o resultado final seja a ordena\c c\~ao dos elementos avaliados
\citep{Stevens:1968}. Este tipo de vari\'avel pode ser encontrada em diversas áreas do
conhecimento \citeonline{Mohs:1954,Stevens:1968,Sorensen+Andersen+Gianola+Korsgaard:1995,Piepho+Kalka:2003,Likert:2007,Correa:2009}, por\'em a
atribui\c c\~ao da vari\'avel ao elemento avaliado \'e realizada de forma subjetiva, principalmente
pela dificuldade em se quantificar determinadas características com o uso da mediç\~ao.
As an\'alises de vari\'aveis ordinais, em sua grande maioria, n\~ao consideram a observaç\~ao feita
por \citep{Stevens:1968} sobre a invari\^ancia de que uma vari\'avel ordinal, que pode ser transformada
desde que a sua informa\c c\~ao emp\'irica seja preservada, pois a maior parte das an\'alises
consideram a vari\'avel ordinal como uma vari\'avel cont\'inua. Diante dos avan\c cos computacionais
ocorridos nos \'ultimos 30 anos, diversas formas de análise para variáveis ordinais foram propostas,
dentre elas o uso de modelos generalizados e generalizados mistos \citeonline{BC:1993,Mc+Searle:2001},
modelos hier\'arquicos bayesianos \citeonline{BD:2006}, modelos thresholds baseados na verossimilha\c ca
\citeonline{Piepho+Kalka:2003,Brockhoff2010330} e modelos thresholds bayesianos \citeonline{Albert+Chib:1993,Cowles:1996,NC,Kizilkaya:2003,ZW,Poon+Wang:2012}.
Dentre as diversas metodologias de an\'alise, os modelos thresholds bayesianos s\~ao considerados
extremamente flex\'iveis e utilizados em diversas \'areas de pesquisa \citeonline{Albert+Chib:1993,Cowles:1996,NC,Kizilkaya:2003, ZW}.
Este tipo de modelo pode ser especificado de forma que uma resposta \'e
observada em uma dada categoria se o valor desta vari\'avel est\'a entre os limites que definem tal
categoria \citeonline{ZW}.
Apesar das recomenda\c c\~oes para o uso de modelos thresholds bayesianos na an\'alise de dados categorizados
ordinais, problemas de converg\^encia nos par\^ametros thresholds s\~ao observados, tornando a
an\'alise extremamente lenta \citeonline{Albert+Chib:1993}. Visando contornar este problema, alguns
autores sugerem modifica\c c\~oes nos algoritmos de forma a torn\'a-los mais eficazes no processo de
converg\^encia dos par\^ametros thresholds \citeonline{Cowles:1996,Kizilkaya:2003,NC,ZW,Poon+Wang:2012}.
\citep{Albert+Chib:1993} foram os primeiros autores a utilizarem um modelo threshold para an\'alise
de dados bin\'arios ou com m\'ultiplas categorias utilizando infer\^encia Bayesiana, por\'em, devido a
complica\c c\~oes no processo de converg\^encia, modifica\c c\~oes no algoritmo original foram
propostas \citeonline{Sorensen+Andersen+Gianola+Korsgaard:1995,Cowles:1996,Kizilkaya:2003, NC}.
Inicialmente, \citep{Albert+Chib:1993} propuseram a amostragem de Gibbs para a obten\c c\~ao da distribui\c c\~ao
marginal dos par\^ametros do modelo utilizando a distribui\c c\~ao t-Student acumulada.
\citep{Sorensen+Andersen+Gianola+Korsgaard:1995} adaptaram o modelo proposto por \citep{Albert+Chib:1993}, por\'em,
utilizando a distribui\c c\~ao normal acumulada como fun\c c\~ao de liga\c c\~ao. Um problema evidenciado por
\citep{Sorensen+Andersen+Gianola+Korsgaard:1995} neste algoritmo \'e a forte autocorrela\c c\~ao entre as estimativas
geradas no processo de amostragem de Gibbs, comprometendo o tempo de processamento devido a necessidade de
obten\c c\~ao de longas cadeias. Na tentativa de amenizar a forte autocorrela\c c\~ao, \citep{Cowles:1996}
prop\^os um algoritmo que a atualiza\c c\~ao dos par\^ametros de limiar e da vari\'avel latente \'e
feita de forma a aceitar ou rejeitar um vetor completo com todos estes par\^ametros. Neste caso,
utiliza-se a amostragem de Gibbs com um passo de Metropolis-Hastings para o vetor em quest\~ao. Apesar do
algoritmo proposto por \citep{Cowles:1996} apresentar melhores propriedades de converg\^encia que os algoritmos
propostos por \citep{Albert+Chib:1993} e \citep{Sorensen+Andersen+Gianola+Korsgaard:1995}, a vari\^ancia
da distribui\c c\~ao geradora de candidatos para a vari\'avel latente \'e de difícil obten\c c\~ao.
Devido a dificuldade de obten\c c\~ao da vari\^ancia para a distribui\c c\~ao geradora de candidatos para os
par\^ametros de limiar e a fim de melhorar o processo de amostragem, com a redu\c c\~ao da autocorrela\c c\~ao
entre as amostras, \citep{NC} propuseram um algoritmo para amostrar par\^ametros associados aos de
limiar limitados entre 0 e 1, tendo como fun\c c\~ao geradora de candidatos para tais par\^ametros a distribui\c c\~ao
de Dirichlet e a distribui\c c\~ao Gaussiana para a vari\'avel latente.
Muitos autores dedicam-se \`a melhoria dos algoritmos para an\'alise de modelos thresholds
bayesianos, por\'em, eles n\~ao s\~ao utilizados em an\'alises de rotina devido a pouca
disponibilidade de softwares que contemplem tais algoritmos. Os poucos softwares que disponibilizam
a an\'alise de modelos thresholds bayesianos podem ser enumerados, sendo o WinBUGS \citeonline{WinBUGS},
MLwiN \citeonline{MLwiN}, glmmBUGS \citeonline{glmmBUGS} e o MCMCglmm \citeonline{MCMCglmm}, por\'em, nenhum destes
softwares possuem a implementa\c c\~ao do algoritmo descrito por \citep{NC} para an\'alise de modelos
thresholds mistos bayesianos ou dos demais algoritmos descritos de forma a facilitar a an\'alise
para o usu\'ario final.
%
%
%
\newpage
\section*{3 CONSIDERA\C C\~OES GERAIS}
\addcontentsline{toc}{section}{\textbf{3}\hspace{1.4cm}\textbf{CONSIDERA\C C\~OES GERAIS}}
%
%
As generaliza\c c\~oes te\'oricas propostas no presente trabalho se mostraram eficazes na melhoria
do processo de converg\^encia dos par\^ametros thresholds para an\'alise de dados categorizados
ordinais, sendo que nos estudos de simula\c c\~ao realizados e
no exemplo de aplica\c c\~ao n\~ao houve diferen\c cas entre a distribui\c c\~ao Gaussiana acumulada ou da t-Student
acumulada como fun\c c\~ao de liga\c c\~ao.
O software desenvolvido para a an\'alise de modelos thresholds mistos bayesianos implementado para
uso em software R vers\~ao 2.15.1 ou vers\~ao superior se mostoru uma ferramenta de uso f\'acil e
acess\'ivel, podendo ser utilizado em an\'alises de rotina. O presente software, denominado
O pacote apresentado nesta tese \'e pass\ível de atualiza\c c\~oes e o seu uso \'e de inteira
responsabilidade do usu\'ario final.
Os capítulos seguintes desta tese constituem dois artigos que resumem o estudo da análise bayesiana de modelos threshold por nós implementado.
No primeiro artigo comparamos os algoritmos em um estudo de simulação para tamahos experimentais representativos de potenciais usos da metodologia.
No segundo artigo apresentamos uma biblioteca R para a análise bayesiana de modelos mistos threshold.
%
%
%=========================================================================================================
%==================================== REFERÊNCIAS BIBLIOGRÁFICAS =========================================
%=========================================================================================================
\newpage
\renewcommand\refname{ }
\section*{\center{REFERÊNCIAS}}
\addcontentsline{toc}{section}{\textbf{ }\hspace{1.4 cm}\textbf{REFERÊNCIAS}}
%
%
% \bibliographystyle{fmc} % Normas do periódico